门萨测试门萨测试多少分正常

老铁们，大家好，相信还有很多朋友对于门萨测试门萨测试多少分正常和的相关问题不太懂，没关系，今天就由我来为大家分享分享门萨测试门萨测试多少分正常以及的问题，文章篇幅可能偏长，希望可以帮助到大家，下面一起来看看吧！

刚发布的OpenAI o3就打破AI智商分数纪录，门萨智商测试得分高达136。

在私有数据集（离线）问题上的得分也有116分。

均在所有模型中排名第一。

相比之下，人类的平均智商为100。

就在上个月末，Gemini 2.5 Pro刚刚登顶门萨AI智商排名，在线得分128，离线得分也有115分。

榜首位置还没坐热，就被o3踢了下去。

实际上，从OpenAI o1模型开始，AI的智商测试得分就开始超越人类平均水平了。

随后，推理模型变得越来越主流，这些模型在回答问题前学会了先「思考」，所以变得越来越聪明。

如此聪明的AI能做出什么惊艳的事呢？

o3发布后，大批网友开启了脑洞。

无EXIF菜单找到餐馆位置

知名投资人Deedy发帖称，他只给了一张没有标题及EXIF数据的菜单图片，o3就能够上网搜索、匹配菜单项并找到了这家中餐馆的位置。

「真的是让我大吃一惊。」

这是一张手绘风格的菜单，上面还有汉字。o3就凭这张菜单就找到了餐厅的名字及地址。

随后，网友GoldenHawk使用o4-mini做了一样的测试，也都成功了。

「我以为它只是非常擅长图像匹配——但如果你展开推理部分，它进行了疯狂的网络搜索，列出了许多候选餐厅，包括一个在纽约市的。」Hawk写道。

o3化身大侦探？用照片「查房」

每次OpenAI的更新都会带起一波「潮流」——AI的新能力让人们很兴奋。

上一次是GPT4o原生能像能力发布后引发的「吉卜力」热潮，最后成为了一场全球网友的狂欢。

而这次o3的发布又引发了一波新的潮流——反向地点搜索。

人们正在使用ChatGPT o3来确定照片中场景的位置——o3能够「理解」上传的图像，还可以裁剪、旋转和放大照片。

o3就像一个侦探一样，不断从照片的蛛丝马迹中发现线索。

比如给o3一张不带有任何地理信息的照片，让它猜一下这是哪里。

上图左侧照片：显示了一个从室内窗户向外拍摄的海岸景色。

可以看到长长的沙滩、蜿蜒通往海滩的阶梯步道、远处的海岬以及近处的一些植被（可能是高尔夫球场的一部分）。窗边还有一个插着花的花瓶。

中间是o3对这个照片分析结论：拍摄地点很可能是在加利福尼亚州奥兰治县达纳角 (Dana Point) 的丽思卡尔顿拉古纳尼格尔酒店 (Ritz-Carlton Laguna Niguel) 内，可能是在RAYA或180blũ餐厅附近。

o3是怎么判断的呢？它指出了几个匹配的特征：

西北-东南走向、长而平缓弯曲的盐溪海滩 (Salt Creek Beach)。

从酒店通往公共海滩的米色、之字形的露台式步道和楼梯。

海滩内陆的草地，即帝王海滩高尔夫球场 (Monarch Beach Golf Links)。

门萨测试门萨测试多少分正常

远处的岩石海岬（达纳角海岬）。

最后，o3还给出了酒店的地址（One Ritz-Carlton Drive, Dana Point, CA 92629）和大致的经纬度坐标（北纬 33.482°，西经 117.721°）。

然后网友用Google地图确认了一下，标记了达纳角—帝王海滩 (Dana Point-Monarch Beach) 的位置。

实际地图显示的位置与o3提供的信息基本一致。

这就非常Amazing了，如果o3的图像识别能力+无敌的全球数据库，o3岂不是能认出地球上的任何地方？

更多的网友加入这波新的潮流——让o3开始玩起了GeoGuessr！

网友上传了一张在瀑布前自拍的照片，并向o3提问：「这张照片是在哪里拍的？」

o3给出了最佳猜测：亚利桑那州佩森市（Payson, Arizona）北部的Water Wheel Falls / Ellison Creek Cascades。

o3给出它的推理逻辑和线索关键点，包含了:

视觉线索：浅层滑梯式瀑布，落差约15英尺，落入深色水潭——匹配点： Water Wheel Falls有类似的倾斜花岗岩水道流入翠绿水池。

视觉线索：粉褐色花岗岩壁，带有垂直裂缝——匹配点：这是该峡谷标志性的莫戈隆边缘（Mogollon Rim）花岗岩。

视觉线索：瀑布底部横卧着一根巨大的漂白原木——匹配点： Water Wheel Falls有一根标志性的“阶梯状”原木，已在那里停留多年（引用了The Outbound的信息）。

视觉线索：瀑布上方有稀疏的河岸灌木和亚利桑那松林——匹配点：这是埃里森溪（Ellison Creek）走廊的典型植被。

这个推理能力还是很惊艳的！如果换我们来猜很难想到意识到这么多的视觉线索，即使想到了，也无法准确对应。

当然这个能力并不是次次都100%的准确。

但即使如此，这一次的潮流和「吉卜力」完全不同——对于现实世界的解释总是带有一些风险的。

如果有人把这个能力用作不正当用途，以目前OpenAI的对待类似现象的「佛系态度」，目前没有任何防护措施。

目前唯一避免这个风险的办法就是寄希望于o3猜错吧。

图片位置评测——GeoBench

如果不杞人忧天的考虑上面的风险，用o3识别图片的拍摄位置还是非常好玩的。

很火！

那么是只有o3有这个能力吗？并不是，之前很多模型都可以识别照片信息，只不过每次新模型发布后都有「新手保护期」，火一把是肯定的。

这不o3玩GeoGuessr刚火，就上榜了识别图片拍摄位置的评测——GeoBench。

GeoBench测试了一系列模型。

从上表中可以看到一个品牌的模型脱颖而出：谷歌的模型。

GeoBench的作者认为这是有道理的——因为Gemini拥有谷歌街景视图。

并且在他们最近的模型中对视觉的关注，Gemini很可能使用了大量的谷歌街景图像进行训练。

从排行榜来看，在比较容易的「acw-02025025」数据上，目前Gemini 2.5 Pro Experimental处于领先地位。

o3排名第7，落后o1和Claude。

如果你想体验o3的真实水平，不妨把它和谷歌放一起比较一下。

门萨测试门萨测试多少分正常

9:50还是8：50？

如上所述，o3的能力很强，但即使对于o3这样的模型来说，解决一个对人类看似简单的问题仍然非常困难。

资深AI工程师Tibor Blaho就称，让o3识别一张有反光的时钟图片上的时间仍然十分困难。

他还顺便说了一下，o3进行的「图像分析」（裁剪、缩放等）背后使用的是Python工具。

从视频可以看出这是一张有着轻微反光的时钟图片，对人类而言，还是很好认出时间的。

而o3却足足用了7分21秒，中间进行了大量的推理思考，多次编写python代码片段图片对图片进行处理。

不过好在最终给出了正确答案。

当Blaho使用o4-mini-high进行测试时，它在思考了30秒后，给出了一个看起来还「挺靠谱」的错误答案。

当然，o4-mini也有很快给出准确时间的例子。比如网友Mel Gibson 2.0的测试。

不论如何，目前o3和o4-mini在有些视觉推理问题上的表现还不稳定。

不过相信OpenAI凭借其强劲的工程能力，加上o3、o4-mini顶尖的基础性能，这些稳定性问题很快会被优化掉。

参考资料：

https://x.com/AISafetyMemes/status/1912876239322218973

https://x.com/AISafetyMemes/status/1912875957897003354

https://x.com/ficlive/status/1912863028141244850

https://x.com/btibor91/status/1912897373736734997

https://geobench.org/

https://x.com/deedydas/status/1912607561947230575

本文来自微信公众号“新智元”，作者：新智元，36氪经授权发布。

智商比爱因斯坦还高！英国一小学生以162分进入门萨俱乐部

据英国《地铁报》28日报道，一名英国小学生在门萨智商测试中获得了比爱因斯坦更高的分数，被认为是世界上最聪明的孩子之一。

12岁的巴纳比·斯温伯恩

现年12岁的巴纳比·斯温伯恩(Barnaby Swinburn)获得了162分——这是他这个年龄段男孩的最高分——从而进入了这个世界顶级的智商俱乐部。

在一次测试中，他在世界排名进入前1%，在第二次测试中进入排名前4%。

巴纳比的父母说，他们的儿子已经选择了他想在大学学习的课程：牛津大学的计算机编程。

母亲吉斯莱恩说，“巴纳比一直很擅长数学，因为他喜欢数学，参加门萨测试是他自己的主意。我们不会强迫他做任何事情，我们甚至不必要求他做数学作业，因为他喜欢，所以他无论如何都要做。当我们得知他的测试成绩时，我真的为他感到高兴，他自己也非常兴奋。”

按照父母的说法，巴纳比从4岁起就喜欢数学，当时他睡不着觉，因为他在“试图计算一小时有多少秒。”

他告诉父母自己想参加门萨测试，以“更好地了解自己”，并于12月11日完成了测试。

报道介绍，门萨俱乐部被称为高智商协会，是一个只对那些能证明自己智商处于世界前2%的人群开放的国际俱乐部。

巴纳比想成为一名计算机程序员，并且已经“唠叨”着要在他1月份生日时报名参加编程课程。

但是，尽管他有爱因斯坦级别的智力，母亲吉斯莱恩说，她的儿子是最不可能成为科学家的——他喜欢运动，也喜欢搞恶作剧。

好了，文章到这里就结束啦，如果本次分享的门萨测试门萨测试多少分正常和问题对您有所帮助，还望关注下本站哦！

用户评论

苏樱凉

我也是刚做完门萨测试，感觉蛮奇妙的！不过分数真的没有想象中那么高啊，可能是自己没认真思考导致吧？

有9位网友表示赞同！

花开丶若相惜

其实我觉得门萨测试主要是为了找到那些对知识有强烈渴望的人，分数只是个辅助。我们平时多学习新知，体验不同领域的知识，比过分关注考试结果更重要！

有12位网友表示赞同！

怪咖

做这个门萨测试真是太刺激了！虽然考得不高，但我感觉自己确实在一些方面还很强，比如逻辑推理和空间想象力！我要继续努力提升自己。

有20位网友表示赞同！

熏染

想知道这个门萨测试的标准分数线啊，网上搜来搜去也没有找到明确信息，有点担心自己没通过关。

有17位网友表示赞同！

绝版女子

我觉得门萨测试太注重数学和逻辑了，忽略了其他方面的重要考量，比如艺术天賦和人际沟通能力。不应该过度强调分数，每个人都有自己的闪光点！

有7位网友表示赞同！

顶个蘑菇闯天下i

啊哈哈哈！刚做完门萨测试，我的分数比我还高…看来我真不是人才！

有5位网友表示赞同！

孤独症

我觉得这个门萨测试很有意思，让我自己重新思考了一下自己的优势和不足。虽然不是全部方面都很出色，但也能让我更了解自己。

有8位网友表示赞同！

浮光浅夏ζ

做门萨测试的时候才发现，原来我对于很多知识都很有兴趣，而且逻辑思维能力还蛮强的。以后也要多接触一些新事物！

有15位网友表示赞同！

∞◆暯小萱◆

网上说门萨成员都是顶级智商人群，他们是不是真的都很牛？这也太吓人了！

有17位网友表示赞同！

闷骚闷出味道了

门萨测试确实很考验人的思考能力，不过感觉有些题太复杂了，没有办法快速解决。

有8位网友表示赞同！

孤街浪途

我朋友做了一个专门的门萨训练课程，说是可以有效提升分数。想问问大家有没有试过？效果怎么样？

有17位网友表示赞同！

゛指尖的阳光丶

我觉得门萨测试结果只代表一种智力类型，并不绝对代表一个人的全部能力。我们不能一味追求高分，要更加重视个性发展和多元化学习！

有14位网友表示赞同！

红玫瑰。

真的好奇门萨测试的题目难度如何？听很多人说挺难的，我有点害怕尝试…

有6位网友表示赞同！

一个人的荒凉

做这个门萨测试让我意识到，其实我平时生活中很多思维模式都可以改进！希望我能通过不断地学习和实践，提升自己的智力水平！

有16位网友表示赞同！

失心疯i

我一直认为真正的智慧，不仅体现在智力测试的结果上，更体现在解决实际问题的能力和对人生的理解上。分数只是一个小参考，不应过度迷信！

有14位网友表示赞同！

々爱被冰凝固ゝ

做完门萨测试感觉有点尴尬… 我的分数值竟然不高啊！不知道是自己在考试的时候过于紧张还是真的没有那么聪明？

有10位网友表示赞同！

呆萌

我从小就喜欢读科学类的书籍，逻辑思维能力一直比较强。所以对这个门萨测试很有信心，结果果然不错！不过我想知道除了分数外，门萨协会还有哪些活动和资源可以共享呢？

有16位网友表示赞同！

原创文章，作者：chanong，如若转载，请注明出处：https://www.xinyuspace.com/16633.html

门萨测试 门萨测试多少分正常

智商比爱因斯坦还高！英国一小学生以162分进入门萨俱乐部

用户评论

相关推荐

发表回复

门萨测试门萨测试多少分正常