Kontakta författare

Grunderna i språket

Vi använder nästan ständigt språk. Oavsett om du pratar med en vän, skriver ett e-postmeddelande eller läser en roman, används språk på något eller annat sätt. Trots att de flesta människor har ett fast grepp om språket är det faktiskt ett mycket komplext system som har lämnat många av de största tänkarna verkligen förbryllade. Språkets komplexitet är kanske en anledning till att många datorsystem inte talar på vår plats, att korrigera vår grammatik eller att översätta våra ord till främmande språk.

Till att börja med anses språket vara en del av semiotiken ett fancy ord för kommunikationssystem. Semiotiska system förlitar sig på tecken och symboler, som ord, för att ge mening. Ett av de enklaste semiotiska systemen är ett trafikljus, varför det ofta fungerar som en utgångspunkt för många lingvister.

Ett trafikljus är ett system som använder tre färger för att kommunicera mening, och det är allmänt förstått av allmänheten. Rött betyder stopp, gult betyder avkastning och grönt betyder gå. Dessa färger är till stor del godtyckliga eller slumpmässiga, i den meningen att du lätt skulle kunna ersätta lila med rött eller blått för grönt, så länge alla förstod förändringarna.

Förutom deras godtyckliga karaktär är dessa lampor också olika. Med andra ord kan du skilja dem från varandra. Om det fanns tre röda lampor skulle kommunikationen upphöra eftersom du inte kunde skilja mellan dem. Så i en mening innebär stopp stopp eftersom det inte betyder gå. Rött är rött, delvis eftersom det inte är grönt.

Språket fungerar på liknande sätt. Dessa idéer tillskrivs ofta till Ferdinand de Saussure, även om många av dessa begrepp går tillbaka till sjuttonhundratalet (åtminstone i västerländsk filosofi). I sitt arbete "En essay om mänsklig [e] förståelse" hävdar John Locke att det finns ett dubbelt system för betydelse, det som är betecknat (ett koncept) och en signifierare (ett ord). Om jag har ett koncept eller en bild av ett träd i mitt huvud, använder jag bokstäverna "träd" för att uttrycka den idén eller konceptet.

Tre grundläggande sätt att tänka på språk

Även om språkvetare har utvecklat och upptäckt många kategorier och aspekter av språk, finns det tre som är värda att notera när de pratar om AutoCorrect och översättningsverktyg. Dessa inkluderar syntax, semantik och pragmatik.

Syntax. Detta är språkets nakna ben. Det består av ordningen av ord eller fraser, grammatik och andra komponenter. Utan korrekt syntax kommer läsare eller lyssnare att bli helt förvirrade.

Semantik. Detta är betydelsen eller definitionen av ord. Till exempel definieras en stol som en individuell plats. Omvänt kan det också vara chefen för en avdelning eller organisation, som ordförande i en kommitté.

I sin bok från Syntaktiska strukturer från 1957 använder Noam Chomsky följande mening för att förklara semantik: "Färglösa gröna idéer sover rasande." Syntaktiskt eller grammatiskt ger denna mening mening; ändå är det nonsens eftersom det är semantiskt osunt.

Pragmatik. Det här handlar om sammanhang. Antag till exempel att du väntar på ett viktigt paket i posten och din make vet detta. Du frågar din make, "Vad är klockan?" De kan svara med att säga, "E-posten har inte kommit ännu." Detta svarar inte på din fråga bokstavligen ("Vad är klockan?"), Men det fungerar som ett deiktiskt uttryck (pragmatiskt).

I en inflytelserik uppsats om språk och litteratur med titeln "Discourse in Life and Discourse in Art" argumenterar Mikhail Bakhtin för att språket har en social komponent. Ord är bara meningsfulla om andra människor använder samma ord och kommunikation bygger på en social händelse mellan en eller flera personer. Kort sagt finns det "extraverbala" komponenter till tal och skrift som måste beaktas. Bakhtin hävdar att "verbal diskurs är en social händelse", en idé som gäller litteratur och vetenskaplig diskurs, såväl som vardagligt tal. Språk är en händelse av utbyte, och det är viktigt att förstå sammanhanget för en sådan händelse för att förstå mening.

Vad har detta att göra med AutoCorrect?

Om språket förlitar sig mycket på social betydelse och på uttalandes sammanhang kan förvirring uppstå mycket lätt. Många program som översätter för bokstavligen eller misslyckas med att korrigera språk saknar ofta komplexitet för att förstå social förståelse - något som ständigt är i rörelse.

Retoriskt sett är varje uttalande både statisk och dynamisk. Ett uttalande beror på ett specifikt sammanhang, som talaren, publiken, miljön, ämnet osv. Det är också dynamiskt i den meningen att ett uttalande kan förändras över tid, få ny mening och förlora gammal mening. I litteraturen är till exempel en "död metafor" en fras som inte längre har sin ursprungliga betydelse, men är allmänt förstås (dvs. "När i Rom!"). Språket ändras i språng och gör det nästan omöjligt för vissa datorer att hålla jämna steg.

Kan datorer hålla uppe?

Vissa forskare tror att datorer aldrig kommer att kunna nå den mentala kapaciteten hos människor; dock är detta inte nödvändigtvis sant - åtminstone när det gäller språk. Autokorrigerings- och översättningsverktyg som inte lyckas fånga mening är egentligen bara enkla program. Teoretiskt kan ett komplext datasystem som speglar det mänskliga sinnet hålla jämna steg med social förståelse och språkliga ledtrådar. Detta är dock lättare sagt än gjort.

Nyckeln till framgångsrik språkprogramvara förlitar sig ofta på imitation. Hur väl kan en maskin agera som den förstår vad som händer? Detta kan vara särskilt svårt när man överväger begränsningar och olika faktorer som regionala dialekter, kulturell bakgrund, ras, religion och otaliga andra saker.

Språk och datorer

Turingtestet, ett tankeexperiment som utvecklats av Alan Turing, förlitar sig faktiskt på ett språkspel för att göra en åtskillnad mellan människor och datorer. Turing frågar: Om en dator kan tänka och kommunicera som en människa bakom stängda dörrar, är det verkligen en skillnad?

En dator skulle förtjänar att kallas intelligent om den skulle kunna lura en människa att tro att den var mänsklig.

Förutsättningen för Turing-testet är detta:

Föreställ dig att du är i ett rum med två dörrar. Bakom den ena dörren är en människa, och bakom den andra en dator. Du kan bara kommunicera med var och en via papperssedlar. Nu måste du bestämma vilken som är människan. För Turing, om en dator är tillräckligt komplex för att verka som en människa, är det liten skillnad mellan de två. Detta kallas ibland en "Black Box" -teori om sinnet.

Cleverbot

Har du någonsin spelat med Cleverbot? Denna feisty dator kan simulera mänskliga konversationer till en viss grad, vilket gör att många ifrågasätter parametrarna för artificiell intelligens (AI). Trots simuleringen av kommunikation skulle Bakhtin hävda att det inte riktigt finns ett språkutbyte som äger rum när en dator talar tillbaka, en idé utvidgad av John Searle.

Det kinesiska rumsexperimentet

Searle säger att det finns en åtskillnad mellan stark AI och svag AI. Stark AI är i princip tanken att datorer kan bli så komplexa att de inte kan skiljas från människor. Svag AI är begreppet att datorer bara kan imitera mänsklig handling och kommunikation. För att visa detta utvecklade Searle det kinesiska rummet tankeexperiment.

Så här går det:

Föreställ dig att du befinner dig i ett förseglat rum med en enda plats till utsidan. Du får en uppsättning manualer skrivna på kinesiska - ett språk som är helt främmande för dig. I grunden säger manualerna: Om A, svar sedan B. Föreställ dig nu att någon glider papper genom spåret, ett papper täckt med kinesiska symboler.

Nu måste du ta dessa symboler, slå upp ett svar i din handbok och skicka tillbaka kupongen med ett korrekt svar. För de kinesiska högtalarna på utsidan av rummet verkar det som om du förstår kinesiska. Men du efterliknar helt enkelt kommunikation. Under hela utbytet saknade semantiken - vilket innebär att du fortfarande inte förstår det kinesiska språket, trots din förmåga att reproducera ett lämpligt svar.

Det här är vad som händer på en dator, säger Searle, eftersom den alltid följer programmering. Det finns ingen förståelse, och därför ingen kommunikation. Som Bakhtin hävdar är språk faktiskt en social händelse ; Ergo kan en dator bara imitera processen.

BBC förklarar Searles kinesiska rum

Sammanfattningsvis...

De flesta datorsystem, som AutoCorrect eller översättningsprogramvara, är inte tillräckligt komplexa för att använda pragmatik eller semantik. Eftersom språket är mycket beroende av dessa funktioner misslyckas många datorsystem med vår avsedda mening. Även om en dator lyckas översätta bra eller korrigera din grammatik, är det kontroversiellt att hävda att språk och kommunikation verkligen äger rum.

Yale-professor Paul Fry diskuterar semiotik