Ang ChatGPT nakamugna og kagubot. Sukad sa pagpagawas sa OpenAI nga dako nga modelo sa pinulongan (LLM) sa ulahing bahin sa Nobyembre, adunay kaylap nga espekulasyon mahitungod sa unsa nga paagi ang generative AIs – diin ang ChatGPT usa ra – mahimong magbag-o sa tanan nga atong nahibal-an mahitungod sa kahibalo, panukiduki, ug paghimo sa sulod. O pag-usab sa mga trabahante ug mga kahanas nga gikinahanglan sa mga empleyado aron molambo. O bisan pagpataas sa tibuuk nga industriya!
Ang usa ka lugar mao ang nag-una nga premyo sa generative AI race: search. Ang Generative AI adunay potensyal nga mabag-o pag-ayo kung unsa ang gipaabut sa mga tiggamit gikan sa pagpangita.
Ang Google, ang dugay na nga nakadaog sa pagpangita sa online, daw kalit nga adunay usa ka tighagit sa Microsoft, nga bag-o lang namuhunan $10 bilyon sa ChatGPT’s developer, ang OpenAI, ug mipahibalo sa mga plano nga ilakip ang himan ngadto sa lain-laing mga produkto sa Microsoft, lakip ang search engine niini, Bing. Samtang, gipagawas sa Google ang kaugalingon nga tool sa AI, Bard, ug ang higanteng teknolohiya sa China nga si Baidu nangandam sa paglansad sa usa ka ChatGPT kakompetensya. Minilyon nga dolyar ang gibubo sa mga generative AI startups usab.
Apan bisan pa sa hype sa ChatGPT – ug generative AI sa kinatibuk-an – adunay mga dagkong praktikal, teknikal, ug legal nga mga hagit nga mabuntog sa dili pa kini nga mga himan makaabot sa sukod, kalig-on, ug kasaligan sa usa ka natukod nga search engine sama sa Google.
Balita Kagahapon
Ang mga search engine nisulod sa mainstream sa sayong bahin sa 1990s, apan ang ilang kinauyokan nga pamaagi nagpabilin nga wala mausab sukad niadto: sa paghan-ay sa mga website nga na-indeks sa ranggo sa paagi nga labing may kalabutan sa usa ka user. Ang Search 1.0 nga panahon nagkinahanglan sa mga tiggamit sa pagsulod sa usa ka keyword o kombinasyon sa mga keyword aron mangutana sa makina. Ang Search 2.0 miabut sa ulahing bahin sa 2000s uban sa pagpaila sa semantic search, nga nagtugot sa mga tiggamit sa pag-type sa natural nga mga hugpong sa mga pulong ingon nga sila nakig-uban sa usa ka tawo.
Gidominar sa Google ang pagpangita gikan mismo sa paglansad niini salamat sa tulo ka yawe nga mga hinungdan: ang yano ug wala’y kasamok nga interface sa gumagamit; ang rebolusyonaryo Algoritmo sa PageRank, nga naghatag ug may kalabutan nga mga resulta; ug ang katakus sa Google sa hapsay nga pagsukod sa kusog nga pagbuto. Ang Pagpangita sa Google mao ang hingpit nga himan alang sa pagsulbad sa usa ka maayo nga gipasabut nga kaso sa paggamit: pagpangita sa mga website nga adunay kasayuran nga imong gipangita.
Apan ingon og adunay bag-ong kaso sa paggamit sa pagtaas karon. Ingon nga giila usab sa Google sa pagpahibalo niini sa Bardang mga tiggamit karon nangita og labaw pa sa usa ka lista sa mga website nga may kalabutan sa usa ka pangutana – gusto nila ang “mas lawom nga mga panabut ug pagsabut.”
Ug mao gyud kana ang gibuhat sa Search 3.0 — naghatud kini mga tubag imbes sa mga website. Samtang ang Google mao ang kauban nga nagpunting kanamo sa usa ka libro sa usa ka librarya nga makatubag sa among pangutana, ang ChatGPT mao ang kauban nga nakabasa na sa matag libro sa librarya ug makatubag sa among pangutana. Sa teoriya, bisan pa niana.
Apan dinhi usab nahimutang ang unang problema sa ChatGPT: Sa kasamtangan nga porma niini, ang ChatGPT dili usa ka search engine, ilabina tungod kay kini walay access sa tinuod nga panahon nga impormasyon sama sa paagi sa usa ka web-crawling search engine. Ang ChatGPT gibansay sa usa ka dako nga dataset nga adunay cut-off sa Oktubre 2021. Kini nga proseso sa pagbansay naghatag sa ChatGPT og impresibo nga kantidad sa static nga kahibalo, ingon man ang abilidad sa pagsabut ug paghimo sa tawhanong pinulongan. Bisan pa, wala kini “nahibal-an” bisan unsa nga labaw pa niana. Kutob sa ChatGPT, wala gisulong sa Russia ang Ukraine, ang FTX usa ka malampuson nga pagbinayloay sa crypto, buhi si Queen Elizabeth, ug ang Covid wala pa nakaabot sa yugto sa Omicron. Kini lagmit ngano nga sa Disyembre 2022 OpenAI CEO Sam Altman miingon“Sayop ang pagsalig [ChatGPT] alang sa bisan unsang importante karon.”
Mabag-o bala ini sa malapit nga palaabuton? Nagpataas kana sa ikaduha nga dako nga problema: Sa pagkakaron, ang padayon nga pagbansay sa usa ka LLM samtang ang kasayuran sa internet nagbag-o labi ka lisud.
Ang labing klaro nga hagit mao ang dako nga kantidad sa gahum sa pagproseso nga gikinahanglan aron padayon nga mabansay ang usa ka LLM, ug ang pinansyal nga gasto nga may kalabotan niini nga mga kapanguhaan. Gitabonan sa Google ang gasto sa pagpangita pinaagi sa pagbaligya sa mga ad, nga gitugotan kini nga mahatagan ang serbisyo nga wala’y bayad. Ang mas taas nga gasto sa enerhiya sa mga LLM naghimo niana nga mas lisud nga makuha, labi na kung ang katuyoan mao ang pagproseso sa mga pangutana sa rate nga gihimo sa Google, nga gibanabana nga naa sa napulo ka libo matag segundo (o pila ka bilyon sa usa ka adlaw). Usa ka potensyal nga solusyon mao ang pagbansay sa modelo nga dili kaayo kanunay ug aron malikayan ang paggamit niini sa mga pangutana sa pagpangita nga naglangkob sa paspas nga pag-uswag nga mga hilisgutan.
Apan bisan kung ang mga kompanya makahimo sa pagbuntog niining teknikal ug pinansyal nga hagit, anaa gihapon ang problema sa aktuwal nga impormasyon nga ihatag niini: Unsa man gyud ang mga himan sama sa ChatGPT nga makat-unan ug gikan kang kinsa?
Tagda ang Tinubdan
Ang mga chatbot sama sa ChatGPT sama sa mga salamin nga gitagana sa katilingban — ilang gibalikbalik ang ilang nakita. Kung pabay-an nimo sila nga mabansay sa wala ma-filter nga datos gikan sa internet, mahimo nilang iluwa ang vitriol. (Hinumdomi ang nahitabo sa Tay?) Mao nga ang mga LLM gibansay sa maampingong gipili nga mga datasets nga giisip sa developer nga angay.
Apan kini nga lebel sa curation wala magsiguro nga ang tanan nga sulud sa ingon ka daghang online nga mga datos sa tinuud nga husto ug wala’y bias. Sa pagkatinuod, a pagtuon ni Emily Bender, Timnit Gebru, Angelina McMillan-Major, ug Margaret Mitchell (gi-kredito isip “Shmargaret Shmitchell”) nakit-an nga ang “dagko nga mga dataset nga gibase sa mga teksto gikan sa internet sobra nga nagrepresentar sa hegemonic nga mga panglantaw ug nag-encode sa mga bias nga posibleng makadaot sa mga marginalized nga populasyon.” Ingon usa ka pananglitan, usa ka hinungdanon nga gigikanan sa datos sa pagbansay sa ChatGPT mao ang Reddit, ug gikutlo sa mga tagsulat ang usa ka pagtuon sa Pew Research nga nagpakita nga 67% sa mga tiggamit sa Reddit sa Estados Unidos mga lalaki ug 64% naa sa taliwala sa edad nga 18 ug 29.
Kini nga mga disparidad sa online nga pakiglambigit sa mga demograpikong hinungdan sama sa gender, edad, rasa, nasyonalidad, socioeconomic status, ug political affiliation nagpasabot nga ang AI magpakita sa mga panglantaw sa grupo nga labing dominante sa curated content. Ang ChatGPT giakusahan na nga “nakamata“ug adunay”liberal nga bias.” Sa parehas nga oras, ang chatbot naghatud usab pag-profile sa rasa rekomendasyon, ug usa ka propesor nga si UC Berkley ang nakakuha sa AI pagsulat code nga nag-ingon nga puti o Asian nga mga lalaki lamang ang mahimong maayong mga siyentipiko. Ang OpenAI sukad nagbutang sa mga guardrail aron malikayan kini nga mga insidente, apan ang nagpahiping problema nagpabilin gihapon.
Ang pagpihig usa ka problema sa tradisyonal nga mga search engine, usab, tungod kay mahimo nila nga madala ang mga tiggamit sa mga website nga adunay mapihigon, rasista, dili husto, o kung dili dili angay nga sulud. Apan tungod kay ang Google usa lamang ka giya nga nagpunting sa mga tiggamit ngadto sa mga tinubdan, kini adunay gamay nga responsibilidad alang sa ilang mga sulod. Gipresentar uban sa sulod ug impormasyon sa konteksto (pananglitan, nahibal-an nga politikanhong mga bias sa tinubdan), ang mga tiggamit mogamit sa ilang hukom sa pag-ila sa kamatuoran gikan sa fiction, opinyon gikan sa tumong nga kamatuoran, ug pagdesisyon kon unsa nga impormasyon ang gusto nilang gamiton. Kini nga lakang nga gibase sa paghukom gitangtang sa ChatGPT, nga naghimo niini nga direkta nga responsable sa mga mapihigon ug rasista nga mga sangputanan nga mahimo niini.
Nagpataas kini sa isyu sa transparency: Ang mga tiggamit walay ideya kung unsa nga mga tinubdan ang anaa sa luyo sa usa ka tubag sa usa ka himan sama sa ChatGPT, ug ang mga AI dili mohatag kanila kung gipangutana. Naghimo kini usa ka peligro nga kahimtang diin ang usa ka makiling nga makina mahimong makuha sa tiggamit ingon usa ka katuyoan nga himan nga kinahanglan tama. Ang OpenAI nagtrabaho aron matubag kini nga hagit WebGPTusa ka bersyon sa AI tool nga gibansay sa paghisgot sa mga tinubdan niini, apan ang kaepektibo niini nagpabilin nga makita.
Ang opacity sa palibot sa sourcing mahimong mosangpot sa laing problema: Academic pagtuon ug anecdotal nga ebidensya nagpakita nga ang generative AI nga mga aplikasyon mahimong plagiarize sa sulod gikan sa ilang training data — sa laing pagkasulti, ang buhat sa laing tawo, kinsa wala mosugot nga ang ilang copyrighted nga trabaho maapil sa training data, wala makadawat ug bayad sa paggamit sa ang trabaho, ug wala makadawat sa bisan unsa nga kredito. (Ang Bag-ong Yorker bag-o lang nga gihulagway kini nga “tulo ka C” sa usa ka artikulo nga naghisgot sa usa ka aksyon sa klase nga kaso batok sa mga generative AI nga kompanya nga Midjourney, Stable Diffusion, ug Dream Up.) Mga kiha batok sa Microsoft, OpenAI, GitHub, ug uban pa nag-pop up usab, ug kini daw sinugdanan sa usa ka bag-ong balud sa legal ug etikal nga mga away.
Ang plagiarism usa ka isyu, apan adunay mga higayon usab nga ang mga LLM naghimo lang og mga butang. Sa usa ka publiko nga sayop, ang Google’s Bard, pananglitan, naghatag sa tinuod nga sayop nga impormasyon mahitungod sa James Webb telescope atol sa usa ka demo. Sa susama, sa dihang gipangutana ang ChatGPT bahin sa labing gikutlo nga papel sa panukiduki sa ekonomiya, kini mibalik uban sa usa ka bug-os nga hinimo-himo nga research citation.
Tungod niini nga mga isyu, ang ChatGPT ug mga generic nga LLM kinahanglan nga mobuntog sa dagkong mga hagit aron magamit sa bisan unsang seryoso nga paningkamot sa pagpangita og impormasyon o paghimo og sulod, ilabi na sa akademiko ug corporate nga mga aplikasyon diin bisan ang pinakagamay nga sayop nga lakang mahimong adunay katalagman nga mga implikasyon sa karera.
Pag-adto sa Vertical
Ang mga LLM lagmit makapausbaw sa pipila ka mga aspeto sa tradisyonal nga mga search engine, apan sa pagkakaron dili sila makahimo sa pagtangtang sa Google search. Bisan pa, mahimo silang adunay mas makabalda ug rebolusyonaryong papel sa pagbag-o sa ubang mga matang sa pagpangita.
Ang mas lagmit sa panahon sa Search 3.0 mao ang pag-usbaw sa tinuyo ug dayag nga gi-curate ug tinuyo nga gibansay nga mga LLM alang sa bertikal nga pagpangita, nga espesyal, mga search engine nga espesipiko sa subject.
Ang bertikal nga pagpangita usa ka lig-on nga kaso sa paggamit alang sa mga LLM sa pipila ka mga hinungdan. Una, nagpunting sila sa piho nga mga natad ug mga kaso sa paggamit – pig-ot, apan lawom nga kahibalo. Kana nagpasayon sa pagbansay sa mga LLM sa mga na-curate nga mga dataset, nga mahimong adunay komprehensibong dokumentasyon nga naghulagway sa mga tinubdan ug teknikal nga mga detalye mahitungod sa modelo. Gipasayon usab niini nga mga dataset nga madumala sa angay nga copyright, intellectual property, ug mga balaod, lagda, ug regulasyon sa privacy. Ang mas gamay, mas gipunting nga mga modelo sa pinulongan nagpasabut usab nga mas ubos nga gasto sa pag-compute, nga mas sayon alang kanila nga mabansay pag-usab sa mas kanunay. Sa katapusan, kini nga mga LLM mahimong ipailalom sa regular nga pagsulay ug pag-awdit sa mga eksperto sa ikatulo nga partido, parehas sa kung giunsa ang mga modelo sa analitikal nga gigamit sa mga regulated nga institusyong pinansyal gipailalom sa higpit nga mga kinahanglanon sa pagsulay.
Sa mga natad diin ang kahibalo sa eksperto nga nakagamot sa makasaysayan nga mga kamatuoran ug datos usa ka hinungdanon nga bahin sa trabaho, ang mga bertikal nga LLM makahatag usa ka bag-ong henerasyon sa mga himan sa pagka-produktibo nga nagpadako sa mga tawo sa hingpit nga bag-ong mga paagi. Hunahunaa ang usa ka bersyon sa ChatGPT nga gibansay sa peer-review ug gipatik nga medikal nga mga journal ug mga libro ug gilakip sa Microsoft Office isip usa ka katabang sa panukiduki alang sa mga medikal nga propesyonal. O usa ka bersyon nga gibansay sa mga dekada sa pinansyal nga datos ug mga artikulo gikan sa pinakataas nga mga database sa pinansya ug mga journal nga gigamit sa mga analista sa bangko alang sa panukiduki. Ang laing pananglitan mao ang pagbansay sa mga LLM sa pagsulat o pag-debug sa code ug pagtubag sa mga pangutana gikan sa mga developers.
Ang mga negosyo ug mga negosyante makapangutana og lima ka mga pangutana kung magtimbang-timbang kung adunay usa ka lig-on nga kaso sa paggamit alang sa pagpadapat sa mga LLM sa usa ka vertikal nga aplikasyon sa pagpangita:
- Ang buluhaton o proseso ba sa naandan nanginahanglan daghang panukiduki o lawom nga kahanas sa hilisgutan?
- Ang resulta ba sa buluhaton gi-synthesize nga impormasyon, panabut, o kahibalo nga nagtugot sa tiggamit sa paglihok o paghimo og desisyon?
- Adunay ba igo nga makasaysayanon nga teknikal o tinuod nga datos aron mabansay ang AI aron mahimong eksperto sa bertikal nga lugar sa pagpangita?
- Ang LLM ba makahimo sa pagbansay sa bag-ong impormasyon sa usa ka tukma nga frequency aron kini makahatag sa pinakabag-o nga impormasyon?
- Legal ba ug etikal alang sa AI ang pagkat-on gikan sa, pagkopya, ug pagpadayon sa mga panan-aw, mga pangagpas, ug kasayuran nga gilakip sa datos sa pagbansay?
Ang masaligon nga pagtubag sa mga pangutana sa ibabaw magkinahanglan usa ka multidisciplinary lens nga naghiusa sa negosyo, teknikal, ligal, pinansyal, ug pamatasan nga mga panan-aw. Apan kung ang tubag “oo” sa tanan nga lima ka mga pangutana, lagmit adunay usa ka kusgan nga kaso sa paggamit alang sa usa ka bertikal nga LLM.
Pagpahiluna sa Abog
Ang teknolohiya sa luyo sa ChatGPT impresibo, apan dili eksklusibo, ug sa dili madugay mahimong dali nga masundog ug ma-commoditize. Sa paglabay sa panahon, ang pagkagusto sa publiko sa makapalipay nga mga tubag nga gihimo sa ChatGPT mawala samtang ang praktikal nga mga kamatuoran ug mga limitasyon sa teknolohiya magsugod na. ligal, ug etikal nga mga hagit nga gihisgutan sa ibabaw, tungod kay kini ang mga unahan kung diin mahitabo ang pagkalainlain sa produkto, ug ang mga away sa AI sa katapusan madaog