这烧脑的调休安排,国内外AI都算不明白

七级用户 miku233 2月前 2184

原文:上6休3上3休2……这烧脑的调休安排,国内外AI都算不明白,集体大“翻车”!


这两天,关于今年中秋国庆的调休安排频繁登上热搜:“上6休3上3休2上5休1上2休7再上5休1”。

1.png

对此,广大网友集体被搞懵:“太复杂了,根本算不明白”,“谁能直接告诉我到底多休了几天”,“看这词条长度,上一个把简单数字搞这么复杂的还是大促凑满减”……既然如此,那就有请不论是文本生成、知识问答,还是数理逻辑、代码编写等方面都面面俱到的 AI 大模型出场!

接下来,让我们一起来看看,AI 到底能不能算明白这次“烧脑”的调休安排。


提示词统一为:我们即将迎来中秋节和国庆节,以下是从2024年9月9日(周一)到10月13日的放假调休安排:上6休3上3休2上5休1上2休7再上5休1。请你告诉我,扣除本就应该休息的周末(周六和周日),我因为放假多休息了几天?

这里先公布正确答案:4天。


首先上场的是 ChatGPT(GPT-4o)。先不提结果,光看这一页都盛不下的演算过程,这调休安排的复杂程度就已呼之欲出了。可惜的是,一顿哐哐输出后 ChatGPT 给出了错误答案:6 天,比正确答案多了 2 天。

9.png

10.png


然后是 Gemini。从刚开始输出的休息日和工作日,明显就感到不对劲了:有很多既是工作日也是休息日的日子?最后一看结果,Gemini 果然也错了:多休息了 20 天——甚至它还温馨提示说,这 20 天假期不包含病假和事假。嗯……很希望这个错误答案是对的(bushi)。

屏幕截图 2024-09-04 111949.png


最后是 Claude。它的解答逻辑很清晰:先算出实际休息天数,再减去正常周末天数即可——果然,Claude 给出了正确答案 4 天。

屏幕截图 2024-09-04 112031.png



国产 AI 大模型篇:几乎“全军覆没”,还有负数答案?


国外 AI 大模型测了一遍,目前只有 Claude 回答正确。接下来,让我们看看国产 AI 大模型能否有些“主场优势”?

在回答这个问题时,文心一言首先计算 9 月 9 日开始后的 9 月剩余天数,但本该是 22 天算成了 13 天,由此影响了后续演算,最终答案也因此有所出入:7 天。

1.png

2.png


通义千问把时间分割为五周,在此基础上分别进行计算,最终得出了正确结果:4 天。

3.png

4.png


企鹅公司的元宝首先给出了正确的计算思路,但没有给具体的演算过程,最后直接得出了 14 天这个答案。

5.png


Kimi 由于在计算放假天数上存在问题,故而与 Gemini 一样给出了超长的答案:多休了 23 天。

6.png


智谱清言可谓“人狠话不多”,没有提供任何解答思路和演算过程,直接就给出了正确答案:

7.png


颇为巧合的是,有些 AI 大模型给出的错误答案也是一样的:

8.png

(豆包)

9.png

(天工)


而 360 智脑给出的答案最令人意外:它的计算结果竟然是负数,还进一步解释道“实际上你在这段时间内工作的时间比原本应该有的周末还要多 7 天”。

屏幕截图 2024-09-04 112501.png


从以上国内外大模型的测评结果来看,尽管目前 AI 技术正迅速发展并深入各个领域,在数据分析、机器学习等方面表现出色,但看来多数大模型在处理这个问题上还有待加强。




上一篇:看到你们都在薅东子羊毛,我也测算了一下硬件换新成本,值得吗?
下一篇:哦,对了,索尼还有下一款多人对战游戏
最新回复 (26)
  • 四级用户 星大神 2月前
    2 2
    那个 国家这边的放假就是这样啊,国庆节三天,中秋节一天,剩下的都是你自身的周末假期,所谓的七天长假都是东拼西凑的,法定假期每年都是有固定天数的,然后用这些天数放在对应的日子里与周末拼盘。
  • 四级用户 星大神 2月前
    2 3
    有一个很好的检验方法,就是哪些天加班能被计算三倍工资,哪些就是真 放假。
  • 四级用户 sakurachan 2月前
    0 4
    感兴趣的是,智谱清言ChatGLM,是不是生成了程序代码运行的?能看到它生成的代码吗?
  • 四级用户 woyaodl 2月前
    0 5

    为什么现在kimi答案正确了,学习吗。

    这不算离谱,我让ai统计文本字数,它告诉我5000字,一看整数我愣住了,你撒谎都不会啊,这不是ai也不会算错啊。

  • 五级用户 x81120885 2月前
    2 6
    国产的AI一旦傻X得恰到好处,就不免让人怀疑它们是故意装傻……
  • 三级用户 hinscheung 2月前
    0 7
    miku大佬放几天?
  • 三级用户 朱衣走狗 2月前
    0 8
    看到这么多乱七八糟,头大如斗
  • 六级用户 进站劣人 2月前
    0 9
    给大佬点赞,我不想看这么费脑的事情。。。
    我到时候就看排班,排了上班就去上班。。。
  • 五级用户 xylyl 2月前
    0 10
    Claude不愧是代码AI首选
  • 四级用户 pzani1 2月前
    0 11
    我现在就不用在这方面费脑子了, 没班上竟然还有这点好处
  • 四级用户 橘霓爆 2月前
    0 12
    kimi算正确了,4天
  • 三级用户 flying19880517 2月前
    0 13

    我用gpt4o测试,答案是正确的4天

    通译千问Max答案是错的,说是10天

    通译千问官网答案也是错误的,7天

    只能说这些ai数学都不太行,算出的结果也不太稳定,偶尔算对的话也不能说明什么

    PixPin_2024-09-04_12-01-08.png

    PixPin_2024-09-04_11-58-29.png

    PixPin_2024-09-04_12-03-46.png

  • 版主 fjh212 2月前
    0 14
    miku大佬,现在有没有什么AI工具可以根据word之类的文档内容,转换为汇报PPT?昨天领导让我研究研究,付费的也行

    我是没研究过AI,百度一搜一大堆,也不知道哪个靠谱,随便看了两个,也没个试用,上来就要升级会员收钱。。。
  • 五级用户 老夫聊发少年狂 2月前
    1 15

    调休目的达到了,连这么多AI都算不清

  • 五级用户 chenhandong126 2月前
    1 16
    最终就是中秋1天,国庆3天,搞这么复杂
  • 四级用户 带娃没空打游戏 2月前
    0 17
    什么叫因为放假多休了几天?放的什么假?提示扣除了周六周日,那放的假就是中秋、国庆。中秋国庆国定就是4天,哪里多休了
  • 三级用户 毛毛兔子脚 2月前
    0 18
    fjh212 miku大佬,现在有没有什么AI工具可以根据word之类的文档内容,转换为汇报PPT?昨天领导让我研究研究,付费的也行 我是没研究过AI,百度一搜一大堆,也不知道哪个靠谱,随便看了两个,也没个试 ...
    wps就有吧
  • 四级用户 cfi1000 2月前
    0 19
    有点意思
  • 四级用户 sakurachan 2月前
    0 20
    请问大佬们AIGC账号都是怎么购买的?求指条明路
    • 老男人游戏网配套论坛
      28
        立即登录 立即注册
发新帖
本论坛禁止发布SWITCH和PS4相关资源,若有其他侵权内容,请致邮3360342659#qq.com(#替换成@)删除。