Skip to main content

Kā lietot Google grāmatu "Ngram Viewer" rīku

Anonim

Ngram, ko parasti sauc par N-gramu, ir teksta vai runas satura statistiskā analīze, lai to atrastu n (skaitlis) kāda veida vienumu tekstā.

Meklēšanas vienums var būt visu veidu lieta, piemēram, fonēzes, priedēkļi, frāzes vai burti. Kaut arī N-grams ir nedaudz aptverts ārpus pētniecības kopienas, to izmanto dažādās jomās, un tam ir liela nozīme tiem izstrādātājiem, kuri kodē datorprogrammas, kuras saprot un reaģē uz dabisko runāto valodu.

Google grāmatu Ngram Viewer gadījumā analizējamais teksts nāk no lielā grāmatu daudzuma, ko Google ir skenējusi no publiskām bibliotēkām, lai iekļautu to Google grāmatu meklētājprogrammu. Google grāmatas Ngram Viewer tās atsaucas uz tekstu, kuru jūs meklējat kā korpuss . Ngram Viewer apkopo pēc valodas, lai gan jūs varat atsevišķi analizēt britu un amerikāņu angļu valodu vai tos vienkopus apvienot.

Kā darbojas Ngram

  1. Iet uz Google grāmatu Ngram Viewer vietnē books.google.com/ngrams.

  2. Ievadiet jebkuru frāzi vai frāzes, kuras vēlaties analizēt. Atdaliet katru frāzi ar komatu. Google iesaka: "Albert Einstein, Sherlock Holmes, Frankenstein", lai jūs sāktu. Prets ir atkarīgs no atbildes, atšķirībā no Google tīmekļa meklējumiem.

  3. Ievadiet datumu diapazonu. Noklusējuma vērtība ir no 1800 līdz 2000.

  4. Izvēlieties korpusu. Jūs varat meklēt svešvalodu tekstus vai angļu valodu, un papildus standarta izvēlei jūs varat pamanīt tādas lietas kā "Angļu valoda (2009)" vai "Angļu valoda (2009)". Šīs ir vecākas korporācijas, kuras Google kopš tā laika ir atjauninājis, taču jums var būt kāds iemesls salīdzinājumiem ar vecajām datu kopām. Lielākā daļa lietotāju to var ignorēt un koncentrēties uz jaunākajām korporācijām.

  5. Iestatiet izlīdzināšanas līmeni. Izlīdzināšana attiecas uz to, cik gluds grafiks ir beigās. Visprecīzākais attēlojums būtu izlīdzināšanas līmenis 0, bet šo iestatījumu var būt grūti lasīt. Noklusējums ir iestatīts uz 3. Vairumā gadījumu jums to noregulēt nav nepieciešams.

  6. Nospiediet Meklēt daudz grāmatu poga

Google ļauj jums nedaudz ieskicēt programmu Ngram Viewer. Ja jūs vēlaties meklēt zivis vārdu vietā zivju lietvārds, to varat izdarīt, izmantojot tagus. Šajā gadījumā jūs meklējat "fish_VERB"

Google nodrošina pilnu sarakstu ar komandām, kuras jūs varat izmantot, un citu uzlabotu dokumentāciju savā tīmekļa vietnē.

Kas parādās Ngram?

Google grāmatu Ngram skatītājs parādīs grafiku, kas atspoguļo konkrētas frāzes lietošanu grāmatās laika gaitā. Ja esat ievadījis vairāk nekā vienu vārdu vai frāzi, jūs redzēsit krāsu kodētas līnijas, lai kontrastu atšķirtos meklēšanas vienumus. Tas ir diezgan līdzīgs Google Trends, tikai meklēšana aptver ilgāku laiku.

Gadījuma izpēte

Apsveriet etiķa pīrāgu gadījumu izpēti. Viņi minēti Laura Ingalsas Vaildera rakstos Mazā māja pie Prairijas sērija. Izpētot ar Google tīmekli, lai uzzinātu vairāk par etiķa pīrāgus, atklājas, ka tie tiek uzskatīti par Amerikas Dienvidu virtuves daļu un tiešām ir izgatavoti no etiķa. Viņi uzklausa laikus, kad ik gadu gada laikā ne visiem bija pieejams svaigs produkts. Bet vai tas ir viss stāsts?

Meklēt Google Ngram Viewer par etiķa pīrāgs un jūs saskaraties ar dažiem pīrāga pieminiem gan 1800. gadu sākumā, gan beigās, daudzos pieminētos 1940. gados, un pēdējā laikā arvien vairāk pieminēts. Tomēr ar izlīdzināšanas līmeni 3 jūs redzēsiet plato pār pieminēt 1800s. Tā kā tajā laikā nav publicētas daudz grāmatu un tāpēc, ka mūsu dati ir iestatīti uz gludām, tas izkropļo attēlu. Iespējams, ka bija viena grāmata, kurā minēts etiķa pīrs, un tas bija tikai vidēji, lai izvairītos no smaile. Nosakot izlīdzināšanu līdz 0, mēs varam redzēt, ka tieši tas tā ir. Spieķu centriem ir 1869, un tur ir vēl viens spike 1897 un 1900.

Maz ticams, ka pārējā laikā neviens nerunāja par etiķa pīrāgus: visur bija iespējams, ka receptes peld visā vietā, bet cilvēki vienkārši neuztraucās rakstīt par tiem grāmatās, un tas ir svarīgs šo Ngram meklēšanas vainu ierobežojums.