OpenAI 在 Cursor 里用 o1-mini 现场捏应用，两分钟控制无人机飞行，新功能剧透

aixo 2024-11-01 12:04:03

2024-11-01 12:04:03

西风发自凹非寺

量子位 | 公众号

在里用o1-mini现场捏应用，两分钟，直接控制无人机飞行。

引得台下观众传来阵阵惊呼：

如此操作，刚刚发生在伦敦开发者日活动上。作为的“科技春晚”，真是好不热闹，现场挤满了人从众。

产品部负责人还剧透了一波o1新功能——

包含功能调用、开发者消息、流媒体、结构化输出、图像理解5个方面。

奥特曼在之后的问答环节表示不想剧透，但透露“图像模型将很快迎来显著提升”。他提到，复制现有模型并不难，而让他为感到自豪的是，他们始终在创造新的突破。

网友们听到这里更兴奋了：

不确定他指的是图像生成还是图像分析，还是两者都有。但想象一下用图像token进行推理。如果你面临一个视觉问题，或许可以逐步地把问题可视化。我目前还没有在其它模型中真正看到过类似的功能。

要在图像方面发力其实也早有迹可循。

不久前，两位清华校友路橙、宋飏就在发布最新图像生成研究。

他们简化了一致性模型，仅用两步采样，就能使生成质量与扩散模型相媲美，速度是扩散模型的50倍。

此外，对于所说的图像模型，还有人猜测不会是前几天登顶文生图竞技场的爆火神秘小熊猫（）吧？

但这种说法很快就被否定了。

小熊猫背后团队 AI已发推文认领，这是他们的新模型-v3。

总之，o1这次算是吊足了大伙儿的胃口，网友喊话赶紧发4.5o和5-：

虽然很棒，但现在仍没有一款编码能打的模型。

奥特曼还说了啥

在现场，奥特曼还被问到的发展方向是更像o1这样的模型，还是会有更大规模的模型？

他表示想在各方面都变得更好，但推理模型的发展对尤其重要。

我认为推理能力将解锁我们多年来期望实现的许多事情，比如在新科学领域做出贡献，或帮助编写非常复杂的代码，这些都会带来显著的推动。所以，大家应该期待o系列模型会快速改进，这对我们来说具有重要的战略意义。

在谈论到“什么是Agent”、“它们可以做什么”，奥特曼表示Agent是一个可以接受长期执行任务，并在执行过程中只需很少监督的东西。

奥特曼认为大家最常举的一个例子是可以让Agent帮忙预订餐厅，它可以用在线餐厅预订平台或者是直接打电话到餐厅。

这确实能为人们减少一些工作，但更有趣的事是能创造一个世界，在那里可以做一些人类无法或不愿做的事。

比如与其让Agent打电话给餐厅预订座位，不如让Agent打给300家，找到最好吃或是最有特色的那一家，它可以并行处理大量任务。

Agent成为一个非常聪明的高级同事，你可以和它在项目上协作，也可以让它独立去做两天甚至两周的任务，做好后带着成果回来与你交流。

接下来，奥特曼还被问到最敬重的竞争对手是哪个，他提到的第一个就是 AI，但随后又补充道：

我的意思是，我现在有点尊敬这个领域里的每个人。我认为整个领域正在涌现出非常了不起的工作，而且有许多才华横溢、非常努力的人。我不是想回避问题，而是想说我可以指出很多非常厉害的人在做非常出色的工作。

要知道，昨天微软刚刚宣布了接入和。

奥特曼转头给了微软竞争对手 AI一个点赞……

此外，奥特曼还被问到最令人兴奋的AI应用场景是什么，他再次Q到Agent：

大家关注的点各不相同，有很多不同的方式可以解决这个问题，但我希望能有一种AI能够理解你整个人生。它不一定需要拥有无限的上下文，但能够有一个AI Agent，某种程度上知道关于你的一切，能够访问你所有的数据之类的东西。

奥特曼还认为大模型的大多数缺点将在未来几代中逐步消失。

不要构建一个填补漏洞或绕过模型缺陷的工具，而是构建一个能利用未来优势的模型。

One More Thing

除了预告，还有最新动作——

开源了一个评估语言模型回答简短、事实性问题能力的新基准，名为。

论文共同一作是去年在X上引得大伙儿纷纷围观的Jason Wei（思维链开山论文一作）和（提示词决斗那会儿还在，现已是工程师）。

有意思的是，o1-mini和o1-在此基准上都不及格，而且两者相差还很大：

参考链接：

[1]

[2]

[3]

[4]

[5]

[6]

[7]

— 完 —

OpenAI

OpenAI 在 Cursor 里用 o1-mini 现场捏应用，两分钟控制无人机飞行，新功能剧透

腾讯设计杰出专家:大模型加速产业进入全新智能时代

涉及量子计算！美国将中国科大、中国科学院物理所等37个实体列入“实体清单”｜硅基世界

站长之家：正筹备展示革命性的人机对话技术

AI搜索的战场，我们为什么要在意的？

联合创始人Mike被任命为首席产品官

微软 Phi-3-vision 基准测试,主打“视觉能力”

中国品牌人物500强前十回应：别在意低头做事

以专业知识内容助力民众跨越自媒体运营门槛

Temu们狂卷低价，亚马逊也坐不住了

微信加大“自媒体”造谣治理力度：限制增粉、阶梯封号