Gemini 美国大豆包
最近网上有人调侃,Gemini 3.5 Flash最大的优点,就是能以最快的速度给你一个错误答案。
这个评价虽然有点损,但也反映了很多普通用户最近的真实体验。以前大家总觉得国外的大模型一定比国产强,现在实际用下来才发现,再厉害的模型也有翻车的时候。
尤其是一些日常问答、中文网络梗或者本土语境,它经常一本正经地胡说八道。有人问它什么叫"美国大豆包",它可能真以为是某种美国特色食品,而国内网友早就把"豆包"当成AI产品的代名词了。
其实大模型最怕的不是不知道,而是不知道自己不知道。
回答慢一点没关系,至少还能让人怀疑它在思考;回答得飞快,却一本正经地编故事,这才是最让人头疼的。
现在AI越来越像一个成绩很好的学生,数学、编程都不错,但碰到生活常识和网络热梗,经常一脸认真地答非所问。
或许未来评价一个AI,不是谁最聪明,而是谁更少"幻觉",大家觉得呢?