2023.03.23. 06:00
Nem fenyegeti a munkáját? Ezeket a felsőfokú vizsgákat sikeresen letette a chatbot
Az OpenAI nemrég jelentette be a GPT-4-et, a frissített chatbotot, amely az ügyvédi vizsgától az AP biológiai vizsgáig sok mindent le tud tenni. Íme néhány kemény vizsga, amelyen mindkét AI-verzió, a GPT-4, és a 3.5 is sikeresen átment.
Forrás: Shutterstock
Fotó: Blue Planet Studio
A GPT-4 az OpenAI jelenlegi „legfejlettebb” AI technológiája. Ahogy már sokan rámutattak, körülményesen fogalmaz, mint egy hivatalnok, néha kimutathatóan blöfföl, füllent, nagyokat téved – mint egy ember. De immáron képes megérteni és megvitatni nemcsak szövegeket és matematikát, hanem képeket is, és nyolcszor annyi szöveget generál, mint elődje, a ChatGPT (amelyet a GPT 3.5 hajt).
A Business Insider szemlézte az új technológia által sikeresen teljesített amerikai felsőfokú vizsgák listáját. A gép teljesítménye azért is elismerésre méltó, mert a diákokkal ellentétben nem tanul külön ezekre a vizsgákra, amelyekre természetesen semmilyen módon nem készítették fel: csak a nyers, általános ismereteit használta.
Ügyvédi vizsga
Míg a GPT-3.5 csak az ügyvédi vizsga 10 százalékában, a GPT-4 a 90 százalékában ért el 400-ból 298 pontot.
Az értékelési sávok küszöbértéke Amerikában államonként változó. New York államban például a vizsgázóknak 266-os, 50 százalék körüli pontszámokat kell hozniuk.
Az SAT
Az SAT (Scholastic Aptitude Test) amerikai felvételi vizsga, amelyet világszerte több egyetemen elfogadnak. Az SAT azt méri, hogy a diák mennyire alkalmas egy amerikai stílusú felsőoktatási intézményben való részvételre. A GPT-4 az OpenAI szerint az SAT Reading & Writing szekciójában 710 pontot ért el a 800-ból.
A matematikai szekcióban a GPT-4 700 pontot ért el a 800-ból, ami 89 százalékos eredmény. A GPT-3.5 pedig 70 százalékot hozott.
A GRE
A GRE (Graduate Record Examination) számítógépes vagy papír alapú teszt, elvégzését kötelezően elvárja az Egyesült Államok legtöbb végzős iskolája a mesterképzésre és a doktori képzésre jelentkezőktől. A GPT-4 pontszámai a GRE során nagyon eltérőek voltak a szekciók szerint.
Míg a vizsga szóbeli szakaszán 99 és 80 százalékot ért el, az írásbelin csak 54 százalékot teljesített.
Amerikai biológiaolimpia elődöntős vizsga
Ez egy rangos nemzeti tudományos verseny, amelyen Amerika legokosabb biológushallgatói vesznek részt. Az első forduló egy 50 perces nyílt online vizsga, több ezer diák vesz részt rajta.
A második forduló – az elődöntő vizsga – 120 perces, három részből áll, feleletválasztós, igaz/hamis és rövid választ tartalmazó kérdésekből. Az OpenAI szerint a GPT-4 a 2020-as elődöntő vizsgán 99-100 százalékos pontszámot ért el.
AP vizsga
Az AP az „Advanced Placement” rövidítése. A középiskolás diákok főiskolai kurzusokon vesznek részt még a középiskolában, hogy felkészítsék őket a további tanulmányokra.
A GPT-4 ezen 5-ös minősítést kapott művészettörténetből, biológiából, környezettudományból, makroökonómiából, mikroökonómiából, pszichológiából, statisztikából. Több tárgyból pedig csak 4-est kapott, közölte az OpenAI.
AMC vizsgák
A vizsgákat középiskolás diákoknak kell letenniük matematikai témákból, például algebrából, geometriából és trigonometriából.
2022 őszén az AMC 10-es 150 összesített pontjából az átlagos pontszám 58,33 , az AMC 12-es esetében pedig 59,9 volt. A GPT-4 30, illetve 60 pontot ért el.
Borfelügyelői vizsga
Bár állítólag nagyon nehéz megszerezni a borfelügyelői képesítést, a GPT-4 az OpenAI szerint 92 százalékos, 86 százalékos és 77 százalékos arányban letette az Introductory Sommelier, Certified Sommelier és Advanced Sommelier vizsgákat is.
Amerikai orvosi engedélyezési vizsga
A kutatók a ChatGPT-t átküldték az Egyesült Államok Orvosi Engedélyvizsgáján. Ez egy három részből álló vizsga, amelyet a leendő orvosoknak az orvosi egyetem után és a rezidensképzés előtt kell letenniük. Az eredményről egy 2022 decemberében közzétett tanulmányban számoltak be.
A ChatGPT „mindhárom vizsgán a teljesítési küszöbön vagy annak közelében teljesített, speciális képzés vagy megerősítés nélkül”.
Úgy tűnik, hogy a nagy nyelvi modellek, így a ChatGPT jól teljesíthetnek az orvosok oktatásában, sőt a klinikai döntéshozatalban is.
Digitália
- Miért kerül annyira kevés pénzbe Indiának a Hold és a Mars elérése?
- Sikeres a tinédzserkorban elvégzett testsúlycsökkentő műtét
- Talán egy polc mélyén nálunk is rejtőzik egy több százezret érő régi játékkonzol?
- Magyarul is beszélő, valódi robotkutyával találkozhatunk az ingyenes hazai eseményen
- Az otthoni rehabilitációt segíti a mesterséges intelligenciával működő hazai fejlesztés