迄今为止最不可思议的5个例子,你知道几个?
今天, 发布了 GPT-4o。它就是我们梦寐以求的钢铁侠。
下面是迄今为止最不可思议的 5 个例子:
1、实时翻译
2、情绪和人脸检测:
3、通过语音指令理解/调试代码
4、生成各种基于情感的声音:
5、从视觉上理解图像、绘图和代码,编码 ELO 能力能提高 100 点
GPT-4o("o "表示 "omni")是向更自然的人机交互迈出的一步。
这应该是苹果 Siri 真正样子
它将面向免费用户并通过 API 提供。
===============================================================
今天 让大家失望了......别失望。现场直播面向的是普通消费者。 很酷的东西都 "藏 "在他们的网站上:
=================================================================
刚刚发布了-4 o,它将彻底改变AI助手游戏。
12个疯狂的例子:
实时视觉助理:帮助盲人打车上车帮助学生实时学习实时翻译会议助理可实时中断并“改变情绪”:见风使舵帮助您在图像中添加多行文本实现会议记录三维物体合成海报创作:一致的多步骤图像创建,精确的文字渲染诗意排版有照片转换为漫画大头照品牌形象定位将文本生成各种字体:利用扩散图像生成文本的新技术;轻松实现图像生成的一致性;即使是手写草书也能生成一致的文本
=================================================================
以AI的另一个重大突破赢得了互联网。 它将他们的功能提升到一个全新的水平。以下是他们今天公布的7项革命性创新:
======================================================================
网友的llm 工具刚刚支持 的新 GPT-4o模型:点这里
pipx install llm
llm keys set openai
# Paste API key here
llm -m 4o "Fascinate me"
要升级现有安装,请执行此操作:
llm install --upgrade llm
自 0.13 版起新增九个插件:
llm--3 支持 的 3 模型系列。llm--r 支持 的 R 和 R Plus API 模型。llm-reka 通过其 API 支持 Reka 系列模型。llm- 由 Geana 设计,支持 Labs 的 API 模型,包括 llama-3-sonar-large-32k- (可在线搜索事物)和 llama-3-70b-。llm-groq 由 提供,用于访问由 Groq 托管的快速模型。llm- 支持由 AI 托管的模型。llm- 增加了对 AI 广泛的公开许可托管模型系列的支持。llm-embed-onnx 提供了可使用 ONNX 模型框架执行的七种嵌入模型。llm-cmd 接受 shell 命令提示符,运行该提示符并将结果填充到 shell 中,这样你就可以查看、编辑它,然后按 执行或按 ctrl+c 取消。
=========================================================================
与 GPT-4 相比,GPT-4o 的速度和额外的编码能力使其在分析方面非常强大。
"分析它。可视化它。进行复杂分析"
给定一个超级英雄的数据集,在没有其他背景上下文的情况下,它可以进行非常令人印象深刻的可视化、PCA、聚类分析......
===========================================================================
说 的演示令人失望的人:
它之所以这么快,是因为它是一个能理解一切的单一集成模型,而不是使用多个模型。
=====================================================================
gpt4o = gpt4.75
gpt4o 比 gpt4 的改进幅度要比 3.5 相对 3 大得多!
现在,它几乎可以完成文本、图像、音频领域的所有工作!
======================================================================
网友讨论:
1、测试者手持苹果与gpt4o对话风趣的对话, 像及了十年前刚刚发布的Siri!当然, 这可能是 为 苹果提供的演示,因为苹果已经决定和合作:
2、老实说,我真的无法想象15年后的世界会是什么样子,我们是多么幸运能够见证即将发生的一切,真的令人难以置信
3、如果“奇点”的概念是准确的,那么我们正处于它的早期阶段。这十年即将发生的事情将使过去的 40 年看起来像石器时代。
4、
5、我今年 66 岁了。几乎每天都像我小时候在 60 年代和 70 年代读过的科幻故事一样。
6、我花了一些时间在操场上测试了新型号的图像识别和推理能力,结果让我大吃一惊。它能从我糟糕的笔迹中找出字符串,而这些字符串在写满笔记和方程式的纸上几乎无法辨认。(顺便说一句,它在所有方面都是正确的)。
7、我在公交车上跪下来流下了喜悦的泪水,希望这些技术能够让人类进入黄金时代
8、总结:
发布了类人化的重大版本:GPT-4o - 汲道