铭鸿体育资讯网

汉语大模型的迭代速度肉眼可见变慢了,是洋人这些头部大厂,今年初就开始严防蒸馏了。

汉语大模型的迭代速度肉眼可见变慢了,是洋人这些头部大厂,今年初就开始严防蒸馏了。之前友商花几个月黑盒蒸馏,趁着汉语地区的农村人多,也不知道咋回事,蒸完直接宣布“全面对标”甚至“局部反超”这类东西,这玩法跑不顺了。

所以都默契地打上“API价格战”了。把百万Token的价格打到几毛钱甚至免费,在基础模型的能力上限上暂时无法突破,就只能靠降价来抢占B端市场。

现在头部公司发布的这些公开模型再厉害,也都是落后它实际版本的。一个原因就是防止友商拿去蒸馏。确保你花几个月蒸馏完,它就发布下一个版本了。不断维持这个代差,确保它是在拉大的。

mythos这类东西 ,所谓主打的”网络安全“,最初的一部分功能就是做这类攻防的。你要蒸馏人家的闭源模型,就需要反推它背后的逻辑链条啊,各种东西。这都需要大量给Claude发消息,24小时不间断提问的。

有的那个AI给出的应对策略十分阴险。检测出你有蒸馏的意图,你像minimax一家,之前就发起了1300 万次对话,这类行为模式和你的IP,哪怕用了几万个假帐号,也都能被AI识别出来的。一旦触发这个防御机制了,它在生成的文本中,会植入特定的逻辑错误,你不再花俩月去处理这类东西,都没法用的。你直观感受就是现在中文大模型,迭代速度肉眼可见变慢了。

急了?黄老师这不就来卖显卡了。