VMTech
+381 11 4183 54024/7 Discuss a project
← All Instagram insights VMTECH · INSTAGRAM

Where did 'goblins' in OpenAI models come from: a lesson on rewards

Откуда в моделях OpenAI взялись «гоблины»: урок о наградах

Odakle su se u modelima OpenAI pojavili „goblini”: lekcija o nagradama

Prijatelji, želim da podelim iz ekosistema OpenAI: tim je otkrio leksički 'tik' — česta pominjanja „goblina” u odgovorima modela.

Šta se desilo: sa GPT‑5.1 porastao je broj pominjanja „goblina” i sličnih bića.

Razlog: treniranje ličnosti „Nerdy” davalo je povišene nagrade za metafore sa 'bićima', a ponašanje se prenelo kroz RL/SFT na druge uslove.

Akcije: uklonili smo „Nerdy”, korigovali signale nagrade, filtrirali podatke koji sadrže termine za 'stvorenja', dodali uputstva u Codex i proširili alate za reviziju.

Zašto je to važno: primer kako sitni signali nagrade formiraju neočekivane tikove i zašto je potreban brz audit modela.

Koje mehanizme kontrole biste Vi predložili za rano otkrivanje takvih efekata?

#OpenAI #veštačkaInteligencija #mašinskoUčenje #NLP

Current metrics
8Views
3Reach
0Likes
0Comments
0Saved
0Shares

Latest comments

No comments yet.

Instagram

Where did 'goblins' in OpenAI models come from: a lesson on rewards

Open the post on Instagram ↗