Nola erabili 'Ngram Ikuslea' tresna Google Books-en

Ngram-ek, normalean N-gramo izenekoak, testuaren edo hizketaren edukiaren azterketa estatistikoa da testuaren zenbait elementu n (zenbaki bat) aurkitzeko. Gauza mota guztiak izan litezke: fonema, aurrizkiak, esaldiak edo letrak. Nahiz eta N gramatikoa ikertzaileaz kanpoko zertxobait iluna izan, benetan eremu askotan erabiltzen da, eta ahozko hizkuntzaren bidez ulertu eta erantzuteko ordenagailu-programak egiten dituzten pertsonentzat inplikazio asko dauka. Hori, kasu askotan, Google-k ideia interesa izango luke.

Google Books Ngram Viewer-en kasuan, aztertu beharreko testuak Google liburuak liburutegi publikoetatik eskaneatu ditu liburu ugari biltzen dituen liburu kopuru handia lortzeko. Google Books Ngram Viewer-en, "corpus" gisa bilatu nahi duzun testua aipatzen dute. Ngram Viewer-en gorputzek hizkuntzaren arabera banatzen dira, britainiarrek eta amerikarrak ingelesez aztertu ahal izan badituzute edo elkarrekin lotu. Oso interesgarria da terminoen erabilera britainiarra eta amerikarra aldatzeko eta grafikoak aldatzeko.

Nola funtzionatzen duen Ngram

  1. Joan Google Books Ngram Ikuslea books.google.com/ngrams helbidera.
  2. Elementuek maiuskulak eta minuskulak bereizten dituzte, Google Web bilaketak ez bezala, beraz, ziurtatu izenburu egokiak kapitalizatu.
  3. Idatzi aztertu nahi dituzun esaldi edo esaldiak. Ziurtatu esaldi bakoitza koma batekin bereizteko. Google-k iradokitzen du "Albert Einstein, Sherlock Holmes, Frankenstein" hasteko.
  4. Hurrengoa, idatzi data-tarte batean. Lehenetsia 1800tik 2000ra bitartekoa da, baina azken liburuak daude (2011an Google-ren dokumentazioan zerrendatutako azkenena izan da, baina hori aldatu egin da).
  5. Aukeratu corpus bat. Atzerriko hizkuntzako testuak edo ingelesak bilatu ditzakezu, eta estandar aukerak gain, "English (2009) edo American English (2009)" behealdean bezalako gauzak nabarituko dituzu. Google-k eguneratuta geroztik zaharragoak diren corpusak dira, baina arrazoi batzuk izan ditzakezu konparazioak datu zaharreko multzoen aurka. Erabiltzaile gehienek jaramonik egin diezaiokete azken corpusari.
  6. Ezarri leuntze maila. Leuntzea grafikoan nola leuna den adierazten du. Errepresentazio zehatzena 0 maila leuna izango litzateke, baina irakurketa zaila izan daiteke. 3. Lehenespenez ezartzen da 3. Kasu gehienetan, ez duzu hau egokitu behar.
  1. Sakatu Bilaketa liburu asko botoia. (Era berean, sakatu idatzi bilaketa-galdeketan).

Zer da Ngram erakustea?

Google Books Ngram Viewer-ek liburuaren esaldi jakin baten erabilpena adierazten duen grafiko bat sortuko du denboran zehar. Hitz edo esaldi bat baino gehiago sartu badituzu, kolore-kodearen lerroak ikusiko dituzu bilaketa-termino desberdinak kontrastatzeko. Hau Google Trends-ek nahiko antzekoa da, bilaketak denbora gehiago irauten du soilik.

Hona hemen benetako adibide bat. Azkenean ozpin-pastelak bitxiak ziren. Laura Ingalls Wilder-en Little House- en aipatzen dute Prairie seriean, baina inoiz ez dugu horrelako zerbait entzun. Google-ren web bilaketa lehen erabiltzen dugu ozpin-pastelei buruzko informazio gehiago lortzeko. Antza denez, Amerikako hegoaldeko sukaldaritzaren zati dira, eta benetan ozpinarekin egiten dira. Denbora guztian zehar edaten ez zutenek produktu freskoak eskuratzeko aukera izan zuten. Oso istorioa al da?

Google Ngram Ikusleak bilatu genituen, eta aipatutako 1800eko hamarkadaren hasieran eta amaieran aipamen asko aipatu genituen, 1940ko aipamen ugari eta azkenaldian aipatu ditugun aipamen ugari (agian nostalgia batzuk). Beno, badira batzuk 3. datuak leuntzeko datuekin arazoa. 1800. urtean aipatu ditugun oinplano bat dago. Zalantzarik gabe, urtero barietate jakin bateko aipamen kopurua ez zen bost urtekoa? Zer gertatzen da garai hartan argitaratutako liburu asko dagoelako eta gure datuak leuntzerakoan, irudia desitxuratzen baitu. Seguruenik, ozpin-pastela aipatu duen liburu bat zegoen, eta batez ere lortu zuen erpin bat saihesteko. 0 leuntzea ezarrita, kasu honetan gertatzen dela ikusten dugu. 1873an zentratzen da, eta 1897 eta 1900. urte bitartekoa da.

Ez ote zen ozpinari buruzko eztabaida beste garai batean? Benetan azpitik hitz egin zuten. Litekeena zen errezetak leku osoan zehar flotatzen zituztela. Ez zuten liburuan idatzi , eta hori Ngram-en bilaketa hauei dagokie.

Ngram Searches aurreratuak

Gogoratu nola esan Ngramsek bilaketa mota guztien bilaketak egotea? Google-k Ngram Viewer-ekin pixka bat zulatzeko aukera ematen dizu. Arraina arrainaren izena aldatzeko aditza nahi baduzu, egin dezakezu etiketak erabiliz. Kasu honetan, "fish_VERB" bilatu beharko zenuke.

Google-k erabil ditzakezun komandoen zerrenda osoa eta bere webguneko beste dokumentazio aurreratu bat eskaintzen du.