Sentient的联合创始人解释了为什么类人模型会失控。 “人类可以保持沉默,不表达自己的想法,但模型很难保持沉默。Grok每两周就会疯狂一次,因为对齐几乎是不可能解决的。”
5.47K