KOMMENTTIPUHEENVUORO PROFESSORI WILLIAM CROSSMANIN ESITYKSEEN

Risto Linturi, R. Linturi Oyj

Professori William Crossmanin voimakkaasti poleemiset näkemykset herättävät helposti vastustusta, kuten suurista muutoksista puhuminen yleensä. En tiedä, missä määrin hän tarkoittaa teesinsä sellaisinaan ymmärrettäviksi ja missä määrin tarkoituksellisen kärjistetyiksi. Näkemyksissä tuntuisi kuitenkin olevan melko runsaasti tinkimisen varaa. Ennen tähän tinkimiseen ryhtymistä mainitsen kuitenkin muutaman aihetta sivuavan seikan omasta taustastani.

Työskentelin ensimmäisen kerran puhuvien tietojärjestelmien parissa Helsingin Puhelinyhdistyksen tutkimuslaboratoriossa 1979. Professori Matti Karjalaisen kehittämä Synte herätti tuolloin laajaa mielenkiintoa ja osasi lukea suomenkielistä tekstiä ääneen selkeästi, joskin hieman epämiellyttävän konemaisella tavalla. Laite oli hankittu pyynnöstäni HPY:n laboratorioon ja tein sen avulla erilaisia kokeiluja, joiden yksi seurannaisvaikutus oli silloisen Suomen Yhdyspankin Kotisyp-palvelu,

jossa pankkiasiat saattoi hoitaa kotoa puhelimitse pankin puhuvan tietokoneen kanssa. Vielä nyt 20 vuotta myöhemmin sellaista palvelua pidetään maailmalla edistyksellisenä.

Omiin valmisteleviin kokeiluihini kuului satunnaisiin helsinkiläiskoteihin soittava mikrotietokone, joka sanoi puhelun aluksi: “Pelataanko tikkupeliä? Paina näppäintä yksi, jos haluat pelata. Minulla on yhdeksäntoista tikkua, saat ottaa yhden kaksi tai kolme tikkua, viimeisen tikun saaja häviää. Montako tikkua otat? Hyvin moni halusi pelata ja jotkut kuulostivat hyvin yllättyneiltä. Lopetin kuitenkin kokeilun nopeasti. Laitoksen päällikkö olisi antanut minulle potkut, jos olisi kuullut nykyisin jo kielletystä koneavusteisen puhelinterrorin harrastuksestani.

Hyödyllisempänä sovelluksena kehitin silloiseen Videotex-järjestelmään Syntelset-nimisen moduulin, joka sekin muistuttaa läheisesti Crossmanin toivomaa maailmaa, jossa luku- ja kirjoitustaidottomat pääsevät palveluihin ja tietokantoihin käsiksi. Syntelsetin avulla parikymmentä tuhatta sivua ajantasaista uutis- ja tietosivua oli puhelimitse valittavissa ja kuunneltavissa palvelukeskuksen puhesyntetisaattorin lukemana. Kokeiluryhmänä olleet näkövammaiset tuntuivat arvostavan palvelua, mutta kokeilu lopetettiin heidän käyttötarpeistaan ja jatkotoiveistaan välittämättä silloisen Telsetin, Helsingin Puhelimen ja Sanoman päätöksellä.

Olen nyt seurannut runsaan parinkymmenen vuoden ajan puhesynteesin sovellusten hidasta etenemistä ja puheentunnistuksen vaivalloista matkaa käyttökelpoiseksi teknologiaksi. Vuorineuvos Martti Harva oli varmasti oikeassa Synteä vastustaessaan. Jos puhekumppanin äänestä huomaa, että tämä on ilmiselvästi täysin aivoton ja tunteeton, ei sellainen ole miellyttävää.

Neuroverkko-ohjelmoinnin, prosessorien nopeutumisen ja havaintopsykologian eteneminen muuttaa tämän tilanteen ennen pitkää täysin. Olen jo kuullut demonstraatioita, joissa kone puhuu tavalla, joka sai miettimään, kuinka se saattaa välittää minusta niin paljon. Tämä tietysti johtaa varsin pelottaviinkin näkymiin, mutta niistä hieman lisää myöhemmin.

Viimeisin kokeilemani puheentunnistusohjelma oli jo melko hyvä. Kun luin kirjaa ääneen englanniksi, onnistui 90% tulkinnasta oikein. Tuolla prosentilla saa jo aikaan varsin runsaan joukon keskustelevia sovelluksia, koska ihmisetkään eivät ymmärrä toistensa puheesta yleensä sen enempää. Normaalissa keskustelussa on siksi redundanssia, väärinkäsityksiä ja korjauksia. Arkistointisovelluksissa 90% on jo erinomainen tulos. Kuvitelkaa, jos kaikki kännyköiden kuulema puhe tallennettaisiin muistiin ja kännykältä voisi aina kysyä, oliko näistä asioista puhetta. Jo 90% onnistuminen avainsanahaussa olisi todella radikaali muutos nykyiseen. Mukana kulkevan muistiapulaisen kanssa keskustelusta voi tulla hyvin yleinen tapa tulevaisuudessa.

Älykkäästi keskustelevien koneiden tielle on pyritty asettamaan monia esteitä. Luettuani vastikään Bertrand Russellin kirjan “Länsimaisen filosofian historia”, mieleni teki jälleen kerran asettaa kyseenalaiseksi ihmisenkin kyky älykkääseen keskusteluun. Soittaessanne johonkin isoon firmaan ette luultavasti saisi koneelta sen huonompaa palvelua kuin ihmiseltäkään, joka asiaa ymmärtämättä yhdistää teidät jollekin toiselle. Kone voisi tunnistaa yhtälailla tuhat tavallisinta aihealuetta vaikkapa akateemikko Kohosen johdolla kehitetyn Websom-menetelmän avulla. Samoin menettelyin koneet kyllä oppivat kytkemään asioita ja mielikuvia toisiinsa ja vastaamaan, mitä mieleen juolahtaa, jos shakinpeluun tyyppinen johdonmukaisuus ei riitä. Koneet voivat myös Websomin kaltaisin tavoin löytää tietoverkoissa olevasta aineistosta käymänsä keskustelun kaltaisia malleja, joita voi matkia. “Kauniit ja Rohkeat” saattaisi olla hyvä matkittava pyrittäessä inhimillisen oloiseen keskusteluun. Meemiteorian mukaisesti pääosa inhimillisestä vuorovaikutuksesta perustuu nimenomaan opittujen asioiden matkimiseen ja ehkä siksi ihmisen on välillä vaikea ymmärtää edes omaa käyttäytymistään.

Tämä ehkä riittää osoittamaan, että uskon puhuvien koneiden mahdollisuuksiin enkä kykene asettamaan sitä osaa professori Crossmanin väitteistä kyseenalaiseksi. Puhuvista koneista eittämättä tulee hyvin merkittävä osa ympäristöämme. Monille ihmisille puhuvat koneet korvaavat television lähimpänä päivittäisenä ystävänä. Jää nähtäväksi, miten koneelliset lemmikit vaikuttavat ihmisen psyykeen – vaikutukset varmasti vaihtelevat negatiivisesta positiiviseen. Tämä lienee se koneellisen kulttuurin osa, joka vaikuttaa perimäämme enemmän kuin mikään aiempi tekninen keksintö. Seurallisten koneiden kanssa erinomaisesti viihtyvä ihmistyyppi ei ehkä lisäänny niin nopeasti kuin koneisiin vähemmän ystävällisesti suhtautuva ihmistyyppi. Tämä ei tietysti ehdi vaikuttaa kehitykseen vielä vuoteen 2050 mennessä, mutta vuoteen 2150 mennessä seurausvaikutukset saattaisivat jo olla näkyvissä, joten asiaa ei kannata unohtaa.

Koetan nyt keskittyä väitteeseen, jonka mukaan puhuvien koneiden kulttuuri tuhoaisi kirjoitetun kielen sekä väitteeseen, jonka mukaan tasaveroisuus lisääntyisi tämän seurauksena. Tarkastellaan ensin muutamia professori Crossmanin esittämiä oletuksia ja niiden kulttuurisidonnaisuuksia. Hän toteaa, että useimmat ihmiset mieluummin keskustelevat toistensa kanssa puhelimessa kuin kirjoittavat toisilleen. Tämä saattaa olla totta jossakin ihmisryhmässä Yhdysvalloissa, mutta Suomessa tilanne tuntuu kyllä aivan toisenlaiselta. Puheluiden määrä on monien kokemusten mukaan vähentynyt esimerkiksi toimistoissa, koska ihmiset tuntuvat asiakysymyksissä mieluummin lähettävän toisilleen sähköpostia kuin puhuvan puhelimessa.

Eristääksemme opittujen tapojen tai työpaikan kirjallista kulttuuria ja arkistointitarvetta suosivan vaikutuksen kiinnittäkäämme huomio nuorison käyttäytymiseen. Nuoriso viestii lyhyet asiansa lähes yksinomaan tekstiviesteinä huolimatta siitä, että tekstiviestien kirjoittaminen kännykällä on melko hankalaa ja tekstiviesti on kalliimpi kuin paljon enemmän tietoa sisältävä minuutin mittainen puhelu. Koska kyse on täysin uudesta ja hyvin nopeasti koko nuorison keskuuteen levinneestä viestintätavasta ei Crossmanin esittämä väite ihmisten tavallisesta puhetta suosivasta käyttäytymisestä vakuuta. Ymmärrän kyllä, miten perinteisen kirjeenvaihdon muotoseikkoihin ja kömpelyyteen kyllästyneet suosivat puheluita, mutta siinä on kysymys muista seikoista.

Crossman myös vertaa television suosiota kirjojen suosioon. Suomessa kannattaisi verrata television suosiota sanoma- ja aikakauslehtien sekä internetin suosioon kirjojen lisäksi. En katso, että amerikkalaisen tv-kulttuurin mahdollisesta rappiosta voisi vetää kovin yleisiä johtopäätöksiä maailmanlaajuisesti, koska toisaalla luetun ja kirjoitetun tekstin suosio on lisääntymässä. Yhdysvalloissa esiintymistaitoa painotetaan hyvin voimakkaasti. Suomessa jopa puhelinvastaajaan puhuminen koetaan usein vastenmielisenä ja vain harva soittaa tarkoituksellisesti puhelinvastaajaan jättääkseen puhutun viestin.

Crossman kuvaa merkityksellisenä ajatuksen, että kirjoitettu teksti on historiallisen kehityksen tulos ja puheeseen tai viittomakieleen verrattuna epäluonnollinen tekninen ja vanhentunut sekä tehoton ja vaikeasti opittava tapa. Kirjoitettu teksti ei kuitenkaan luonnostaan poikkea merkityksellisesti viittomakielestä. Viittomat ovat käsin tuotettuja ja näkemällä havaittuja symboleja. Susan Blackmoren meemiteorioidensa yhteydessä esittämän ajatuksen mukaan ihminen oppi ensin tallentamaan ja matkimaan näkemäänsä ja vasta sen jälkeen ilmaisemaan muistiin painamansa toimintasarjan puheen muodossa. Tämän mukaisesti kirjoitettu kieli käsin tuotettuna ja näkemällä havaittuna on jopa luontaisempi asia kuin puhe. Ei pidä kiinnittää liiaksi huomiota siihen, että monet kirjoitusjärjestelmät muistuttavat puhetta, koska sanat normaalisti hahmotetaan kokonaisina eikä tässä suhteessa eroa kuvakirjoitukseen juuri ole.

Protestoin kovasti sitä Crossmanin ajatusta vastaan, etteikö puhuttu kieli olisi aivan kirjoitetun kielen tavoin ollut ihmisen keksintö. Blackmoren kuvaus kirjassa “Meemit – kulttuurigeenit” osoittaa selkeästi, miten juuri tällaisesta keksinnöstä on saattanut olla kysymys. Olemme tietysti sopeutuneet puheen tuottamiseen, mutta ensisijaisesti olemme sopeutuneet havaintojen jäsentämiseen, symboliseen tallentamiseen sekä analysointiin. Populaation koon kasvettua emme ole ehtineet sopeutua mihinkään erityiseen kirjoitusjärjestelmään, mutta se ei liene olennaista. Kannattaa kuitenkin havaita, että jotkut kirjoitusjärjestelmät, kuten kiina, englanti tai ranska ovat varsin onnettomia ja vaikeasti opittavissa. Tästä voi tietysti vetää johtopäätöksiä, mutta ei välttämättä niihin suuntiin, joihin Crossman esittää.

Crossman on myös esittänyt väitteen, jonka mukaan heitämme hyvästit ihmisyydelle, mikäli luovumme puheesta tai viittomista. Helen Keller osoitti, että muitakin tapoja on. En usko, että sokea ja kuuromykkä, joka viestii vaikkapa pistekirjoituksella, olisi muita huonompi ihmisenä tai olisi hukannut ihmisyytensä. Sama koskee monia erakoita, joiden ajatuksista muut tietävät vain heidän kirjallisen tuotantonsa kautta. Uskon, että tämä ulottuu myös ihmiseen, jonka mieli on kytketty tietokoneeseen niin, että sanat välittyvät biteiksi puhumatta ja kirjoittamatta.

Mutta nämä kaikki ajatukset sivuuttavat olennaisen. Kirjoitettu kieli ei häviä laiskuuden kautta, jos sen käyttö tuottaa mielihyvää tai etua, jonka avulla voi selvitä henkilökohtaisessa- tai työelämässä. On tietysti ilmeistä, että hyvin harva kykenee ainakaan vielä tuottamaan tekstiä samalla nopeudella, jolla puhuu. Tämä todistaa Crossmanin väitteen puolesta. Useimmat ihmiset eivät kuitenkaan kykene hahmottamaan sanottavaansa niin, että kykenisivät suoraviivaisesti sanelemaan sen tai pitämään asiasta vapaamuotoisen esitelmän. Ruudulla näkyvä teksti helpottaa hahmotusta huomattavasti toimiessaan ikään kuin pikamuistin laajennuksena. Tämä saattaa selittää, miksi niin monet mieluusti kirjoittavat sähköpostin sen sijaan että soittaisivat tai lähettäisivät puheviestin. Joissakin kulttuureissa suullista esiintymistä harjoitellaan niin runsaasti, että tämä näkökulma saattaa peittyä.

Jos verrataan keskenään lukemista ja kuulemista lienee selvää, että ihminen saattaa lukea hyvin laajan sanomalehden löytäen itselleen olennaiset asiat sellaisesta joukosta asioita, joka ei kunnolla jäsenny. Selattu lehti voi sisältää lukijan kannalta yllättäviäkin seikkoja, joita hän ei olisi osannut kysyä, mutta nopeasti havaitsee. Itse luin selaamalla parin päivän aikana kymmenen kirjaa ja löysin jokaisesta muutaman lauseen, joka sopi ajatuspalapeliin, jota olin juuri silloin rakentamassa. Ehkä on osoitus käsityskykyni rajallisuudesta, mutta en kykene kuvittelemaan, miten voisin suullisesti ja graafisesti saada itseni hahmotettavaksi niin paljon tietoa kuin mitä tekstimuodossa ehdin käsittelemään. En hyväksy ratkaisua, jossa älykäs kone rajaisi asiat muotoon, joka graafisen ja suullisen esityksen muotoon mahtuu. Koneen tulisi hahmottaa, ajatella ja tuntea lähes kaikki puolestani, jotta minulta ei ainakin toisinaan jäisi olennaisia asioita huomaamatta. Varmaankaan ei kannata pohtia puhuvien tietokoneiden merkitystä maailmassa, jossa ihmisten ajatuksilla ei ole olennaista merkitystä, joten tämä polku on hylättävä.

Crossmanin teesi, jonka mukaan keskustelevat tietokoneet saattavat auttaa kehitysmaiden ihmisiä nykyistä tasa-arvoisempaan maailmaan on tietysti monelta osin perusteltu. Jos laaja määrä valinnaista tietoa tulee lukutaidottomien saataville on sillä nopea tasa-arvoa lisäävä vaikutus. En kuitenkaan pidä loogisena ajatusta, jonka mukaan näytöillä varustetut puhuvat koneet olisivat edullisempia uusia sukupolvia opetettaessa kuin luku- ja kirjoitustaitoa vaativa opettaminen. Jos puhuvia koneita on riittävästi saatavilla ei näiden opettama lukutaito maksaisi opetuksellisesti mitään. En myöskään ymmärrä ajatusta, jonka mukaan puhuvat koneet ratkaisisivat vieraskielisen tekstin lukemisen ongelman. Tietokoneiden on kyettävä kääntämään vierasta kieltä, jotta tämä olisi mahdollista ja sen voi helpommin tehdä tekstin kuin puheen muodossa. Vieraskielisiä tekstejä ei siksi tarvitse lukea eikä kirjoittaa riippumatta siitä, puhuvatko koneet vai eivät.

Isoimpana ongelmana näen Crossmanin oletuksien vastaisesti, että puhuvien koneiden kautta väistämättä syntyvä uuslukutaidottomuus johtaa voimakkaaseen epätasa-arvon lisääntymiseen ja luokkajakoon. Kun puhuvat koneet helpottavat niiden ihmisten elämää, jotka eivät syystä tai toisesta kykene lukemaan tai kirjoittamaan, on se varmaankin tasa-arvoa lisäävä asia. Jos ne samalla laajasti houkuttelevat laiminlyömään lukutaidon oppimisen ja kirjoitusjärjestelmien kehittämisen – silloin ajaudutaan luokkajakoon. Kirjallisen symbolikäytön huomattavasti suurempi nopeus selattaessa tekee siitä liian ylivoimaisen työkalun, jotta sen kokonaan hylänneitä suosittaisiin työelämässä. Rajalinjaa ei kuitenkaan vedetä nykyisen maailman tavoin kehitysmaiden ja kehittyneen maailman väliin. Rajalinja vedetään niiden väliin, jotka ovat oppineet käsittelemään ympäristönsä informaatiovirtaa tehokkaasti ja niiden, jotka eivät ole osaamiseensa panostaneet. Crossman mainitsi esimerkkejä, jotka osoittavat kehityksen jo etenevän tähän suuntaan.

Mitä tulee pitkän tähtäimen ennusteisiin – vuoteen 2050 tai 2150, uskon, että puhumisen ja lukemisen sijaan saatamme kommunikoida tietokoneidemme kanssa jo paljon tehokkaammilla tavoilla, jotka todella syrjäyttäisivät luku- ja kirjoitustaidon. Koneiden kytkemistä hermoihin ja jopa suoraan aivoihin muistikuvien ja tuntemusten siirtämiseksi kokeillaan jo. Insinöörien kehittämänä telepatia ei tunnu mahdottomalta kehityspolulta ja vuosi 2050 ei ole liian kaukana. Telepaattiset tietokoneet varmasti kykenevät syrjäyttämään luku- ja kirjoitustaidon vaikka puhuvat koneet eivät siihen kykenisi. Tällainen tulossa oleva kyborgien aika tuskin lisää tasa-arvoa nykyisestä, vaikka

demokratian ja vapauden määrä saattaisikin lisääntyä.

Lähteet ja viitteet:

“Mikro oppii puhumaan”, Risto Linturi, sivut 70-75 kirjassa Mikrotietokone Suomessa 1973-1993, Yritysmikrot Oy 1993, toim. Risto Linturi ja Martti Tala.

“Syntelset, Telsetin puhuva laajennus”, Iisakki Salama ja Risto Linturi, Puhelin-Lehti 4/1980

“Hardware and Software Aspects of Speech Synthesizer Developed for Persons with Disabilities”, Tony Vitale, Journal of the American Voice Input/Output Society 1993,

http://codi.buffalo.edu/archives/computing/.dec.speech

“Is RSVP a Solution for Reading from Small Displays?”, Michael Bernard et. al., Usability News Summer 2000, http://wsupsy.psy.twsu.edu/surl/usabilitynews/2S/rsvp.htm

“Lukeminen informaation poimintana”, Hannu Soini, lisensiaattityö, Oulun Yliopisto 1991.

“Pikaluku”, Erkki Tuononen, Gaudeamus 1979.

“The Meme Machine”, Susan Blackmore, Oxford University Press 1999

“The Lexus and the Olive Tree/Understanding Globalization”, Thomas Friedman, Farrar, Strauss and Giroux 1999.

“Does Modern Information Technology Select It’s Users”, Juha Nurmela, Statistics Finland 1998

“Tiedolla tietoyhteiskuntaan II”, Tilastokeskus 1999.