ChatGPT V4 מנצח את הבר, SATs ויכול לזהות ניצולים בחוזי ETH

GPT-4, הגרסה העדכנית ביותר של הצ'אטבוט של בינה מלאכותית (AI), ChatGPT, יכולה לעבור מבחני תיכון ומבחנים של בית ספר למשפטים עם דירוג ציונים באחוזון ה-90 ויש לו יכולות עיבוד חדשות שלא היו אפשריות בגרסה הקודמת.

הנתונים מציוני המבחנים של GPT-4 שותפו ב-14 במרץ על ידי היוצר OpenAI שלו, וחשף שהוא יכול גם להמיר קלט של תמונות, אודיו ווידאו לטקסט בנוסף לטיפול ב"הוראות הרבה יותר ניואנסיות" בצורה יצירתית ואמינה יותר.

"זה עובר בחינה מדומה של הלשכה עם ציון סביב 10% הנבחנים המובילים", הוסיפה OpenAI. "לעומת זאת, הציון של GPT-3.5 היה סביב ה-10% התחתונים."

הנתונים מראים ש-GPT-4 השיג ציון של 163 באחוזון ה-88 בבחינת LSAT - המבחן שסטודנטים במכללות צריכים לעבור בארצות הברית כדי להתקבל לבית ספר למשפטים.

*תוצאות הבחינה של GPT-4 ו-GPT-3.5 במגוון של בחינות אחרונות בארה"ב. מָקוֹר:* *OpenAI*

הציון של GPT4 ישים אותו בעמדה טובה להתקבל לבית ספר למשפטים המובילים 20 והוא נמוך רק בכמה סימנים מהציונים המדווחים הדרושים להתקבל לבתי ספר יוקרתיים כמו הרווארד, סטנפורד, פרינסטון או ייל.

הגרסה הקודמת של ChatGPT השיגה רק 149 ב-LSAT's והכניסה אותה ל-40% התחתונים.

GPT-4 קיבל גם ציון של 298 מתוך 400 בבחינת הלשכה האחידה - מבחן שנערך על ידי סטודנטים שסיימו לאחרונה את לימודי המשפטים המאפשר להם לעסוק כעורכי דין בכל תחום שיפוט בארה"ב.

*ציוני UBE נדרשים להתקבל כדי לעסוק בעריכת דין בכל תחום שיפוט בארה"ב. מָקוֹר:* *הכנס הארצי של בוחני עורכי הדין*

הגרסה הישנה של ChatGPT התקשתה במבחן הזה, וסיימה ב-10% התחתונים עם ציון של 213 מתוך 400.

באשר למבחני קריאה וכתיבה מבוססי SAT ו-SAT מתמטיקה שנבחנו על ידי תלמידי תיכון בארה"ב כדי למדוד את מוכנותם לקולג', GPT-4 קיבל ציון באחוזון ה-93 וה-89 בהתאמה.

GPT-4 הצטיין גם במדעים ה"קשים", ופרסם ציוני אחוז גבוהים הרבה יותר מהממוצע בביולוגיה AP (85-100%), כימיה (71-88%) ופיזיקה 2 (66-84%).

*תוצאות הבחינה של GPT-4 ו-GPT-3.5 במגוון של בחינות אחרונות בארה"ב.* *מקור: OpenAI.*

עם זאת, ציון ה-AP Calculus שלו היה ממוצע למדי, דירוג באחוזון 43r עד 59.

תחום נוסף שבו היה חסר ל-GPT-4 היה בחינות ספרות אנגלית, פרסום ציונים באחוזון 8 עד 44 בשני מבחנים נפרדים.

OpenAI אמרה ש-GPT-4 ו-GPT-3.5 עברו את המבחנים הללו מבחינות התרגול של 2022-2023, וכי "לא נלקחה הכשרה ספציפית" על ידי כלי עיבוד השפה:

"לא עשינו הכשרה ספציפית לבחינות האלה. מיעוט מהבעיות בבחינות נראו על ידי הדוגמנית במהלך האימון, אך אנו מאמינים שהתוצאות מייצגות".

התוצאות עוררו פחד גם בקהילת הטוויטר.

מידע נוסף: כיצד ChatGPT ישפיע על מרחב ה-Web3? תשובות בתעשייה

ניק אלמונד, מייסד FactoryDAO אמר לי 14,300 העוקבים שלו בטוויטר ב-14 במרץ ש-GPT4 הולך "להפחיד אנשים" וזה "ימוטט" את מערכת החינוך העולמית.

תורת ההערכה הייתה חלק גדול מהחיים שלי במשך כמה שנים. דפקתי על היום הזה שהגיע לפני שנים רבות. ממש נשמעתי כמו הארכובה של התושב באותה תקופה.
אבל... באמת זה אומר שכל דבר מלבד הערכה מפוקחת נגמר מנקודה זו ואילך.
— drnick ️² (@DrNickA) במרץ 14, 2023

מנהל Coinbase לשעבר, קונור גרוגאן, אמר שהוא הכניס חוזה חי של Ethereum ל-GPT-4 והצביע מיד על כמה "חולשות אבטחה" והתאר כיצד ניתן לנצל את הקוד:

זרקתי חוזה Ethereum חי לתוך GPT-4.
ברגע אחד, הוא הדגיש מספר פרצות אבטחה והצביע על אזורי פנים שבהם ניתן לנצל את החוזה. לאחר מכן הוא אימת דרך ספציפית שבה אוכל לנצל את החוזה pic.twitter.com/its5puakUW
- קונור (@jconorrogan) במרץ 14, 2023

ביקורת חוזים חכמים מוקדמים יותר ב-ChatGPT גילו שהגרסה הראשונה שלו גם מסוגלת לזהות באגי קוד במידה סבירה מדי.

רואן צ'ונג, המייסד של ניוזלטר הבינה המלאכותית "The Rundown" שיתף סרטון של GPT מתמלל אתר מזויף שצויר ביד על פיסת נייר לקוד.

זה עתה צפיתי ב-GPT-4 הופך סקיצה מצוירת ביד לאתר פונקציונלי.
זה מטורף. pic.twitter.com/P5nSjrk7Wn
- רואן צ'ונג (@rowancheung) במרץ 14, 2023