西瓜资讯

o4-mini秒怂弃赛,Claude 20分钟通关

2025-05-14

【新智元导读】陶哲轩YouTube视频第二弹震撼来袭!这一次,他让AI挑战在Lean中形式化代数蕴含证明,结果Claude约20分通关,o4-mini太过谨慎直接「弃赛」。

3天后,陶哲轩YouTube视频二更来了。

这次,他尝试了一种更短、更概念化的证明版本,并测试Claude、o4-mini能否基于之前的非形式和形式证明,生成类似的形式化代码。

实验的核心是,在Lean中形式化同一个代数蕴含的证明。

此外,他还发文深入剖析了,自动化工具不同尺度上的效率表现,以及自动化与人工干预之间的微妙平衡。

最新文章

数码

 

阅读13355

OPPO Reno14 系列正式亮相!

汽车

 

阅读12774

小米这次的大招让所有人等了8年!

数码

 

阅读19826

使用14小时,电量还剩40%

数码

 

阅读19951

华为、小米霸占前二,vivo滑落到第四

科技

 

阅读16203

晋ICP备2024051176号-31