我黑客，接受全网挑战！ - 第374章好戏上演

第374章好戏上演

从图表上可以看出，o1模型的得分，明显高于其他AI模型，呈现出一种“一骑绝尘”的姿态。

真的是这样吗？

嘿嘿！

苏阳看着屏幕上奥特曼的表演，呵呵笑。

“这些所谓的专业测试，也就只能骗一骗那些不懂技术的普通网民罢了。

原因很简单，这样的测试，完全是可以刷题。

只要提前让AI模型学习大量的类似题目，它就能在测试中取得高分。但这并不代表它真的具备了强大的推理能力，更像是一种应试技巧而已。

与此同时，openAI的发布会现场，奥特曼还在滔滔不绝地吹嘘着o1模型在数学基准测试上的优异表现。

“在GSm8K测试中，”奥特曼指着大屏幕上一张图表，“o1模型的得分达到了惊人的95.4%！这比排名第二的模型高出了近5个百分点！这是一个巨大的差距！这意味着什么？这意味着，o1模型在解决数学应用题方面，已经达到了接近人类专家的水平。”

奥特曼不断地强调o1模型在各种数学基准测试上的出色表现，试图营造出一种“openAI再次站在了人工智能技术最前沿”的氛围。看他自信满满的表情，仿佛在告诉全世界：openAI才是人工智能领域的王者。

直播间的评论区里，赞叹声再次占据了主导地位。许多网友被o1模型在数学基准测试上的出色表现所折服，纷纷表示惊叹和赞赏。

“太强了！openAI果然是AI领域的领导者。”

“95.4%！这简直是不可思议！”

“o1模型已经超越人类了！”

“openAI又一次改变了世界！”

但是，那些质疑的声音，并没有完全消失。一些网友仍然坚持认为，o1模型与磐石科技的小团子AI模型相比，并没有明显的优势。他们认为，这些数学基准测试，并不能完全代表AI模型的真实能力，更像是一种“应试教育”的产物。

“这些测试，小团子也能轻松刷到高分吧。”

“光看测试成绩有什么用？还是要看实际应用。”

“openAI是不是在自娱自乐？”

“感觉o1模型并没有什么突破性的进展。”

面对这些质疑，奥特曼决定用一个现场演示来彻底征服所有人。

“为了让大家更直观地了解o1模型的推理能力，”奥特曼说道，“我们现在就让o1模型现场解答一道高数题。”

他看向了mR李。

mR李在操作。

与此同时，苏阳对团团说道：“团团，好戏，可以开演了。”

“收到。”

发布会现场，技术员已经将一道复杂的高等数学题输入到了o1模型中。这是一道关于傅里叶变换的题目，需要用到多种积分技巧和变换公式，难度相当高。

奥特曼站在一旁，脸上带着自信的微笑，等待着o1模型给出完美的解答。

o1模型开始进行推演。

然而，令人意想不到的事情发生了。

第一次，o1模型推演到一半，突然卡住了，屏幕上显示出一堆乱码，然后……死机了。

第374章 好戏上演