最近,研究人员开发了一种新的通用光学字符识别(OCR)模型,名为 GOT(通用 OCR 理论 。在他们的论文中,首次提出了 “OCR2.0” 的概念,这个新模型旨在将传统 OCR 系统的优点与大型语言模型的强大功能结合起来。...
-
-
最近,NVIDIA 的最新一代 Blackwell GPU 引发了前所未有的需求,CEO 黄仁勋在一次投资者会议上透露,未来12个月的供应量已经完全售罄。这一现象与几个月前 Hopper GPU 的火爆情况相似,说明了市场对...
-
在科技圈,总有一些令人瞩目的动态,这次轮到 OpenAI 和微软的 AI 大咖们抢镜。听说微软的 AI 副总裁 Sebastien Bubeck 即将光荣离职,准备投奔 OpenAI,继续追寻那神秘的 AGI(通用人工智能)...
-
最近,Lidwave 宣布成功获得1000万美元的融资,目标是提升机器视觉的能力,尤其是在繁忙环境中识别行人等关键应用。Lidwave 的 CEO Yehuda Vidal 在接受采访时表示,他们的创新技术4D LiDAR...
-
在硅谷,车库文化孕育了许多科技传奇,而Christoph Kohstall的车库则可能是下一个。他的工作空间里,电气组件、工作台和机械工具随处可见,而最引人注目的莫过于天花板上的红色工业梁——一个用于稳定机器人测试阶段的龙门...
-
OpenAI近期对ChatGPT进行了重大更新,不仅改变了用户界面,还引入了革命性的搜索功能。这次更新标志着ChatGPT从单纯的对话助手向综合性信息平台的转变。界面更新主要体现在两个方面:首先,新增的Canvas功能在右侧...
-
一家来自慕尼黑的创新型初创公司Beyond Presence正在开创计算机视觉应用的新纪元。该公司结合先进的智能手机技术和AI能力,正在开发一种突破性的超真实头像技术。这种技术旨在创造出外观和声音与真人完全一致的虚拟形象,并...
-
最近,研究人员开发了一种名为 DIAMOND(Diffusion for World Modelling)的 AI 模型,它能够在神经网络中模拟著名的电脑游戏《反恐精英:全球攻势》(CS:GO 。这个模型在一张 Nvidia...
-
最近,谷歌宣布与核能初创公司 Kairos Power 达成协议,计划建设七座小型核反应堆,以为其数据中心提供电力。这一合作将为谷歌的运营带来约500兆瓦的零碳电力,正值数据中心和人工智能对能源需求激增的时期。图源备注:图片...
-
Meta首席技术官Andrew Bosworth近日向The Verge证实了一项重要决策:公司取消了原定于2027年发布的高端头显Quest Pro2(代号La Jolla),同时正在开发一款全新的超轻量头显。这一消息不仅...