近年来,随着大型语言模型(LLMs)的快速发展,自然语言处理领域经历了前所未有的变革。这些技术如今广泛应用于代码助手、搜索引擎和个人 AI 助手等场景,展现了强大的能力。然而,传统的 “下一个 token 预测” 范式存在一...
-
-
近年来,图像重光照技术的进步得益于大规模数据集和预训练的扩散模型,使得一致性光照的应用变得更加普遍。然而,在视频重光照领域,由于训练成本高昂以及缺乏多样化和高质量的视频重光照数据集,进展相对缓慢。仅仅将图像重光照模型逐帧应用...
-
微软近日发布了 OmniParser V2.0,这是一个旨在将用户界面(UI)截图转换为结构化格式的全新解析工具。OmniParser 能够提高基于大型语言模型(LLM 的 UI 代理的性能,帮助用户更好地理解和操作屏幕上的...
-
阿里巴巴集团控股有限公司(NYSE:BABA)近期股价飙升超过50%,这主要得益于投资者对 AI(人工智能 发展的乐观预期。尽管由于核心零售业务的增长乏力以及中国的地缘政治风险,阿里巴巴的估值一直处于低位,但这并没有阻止其股...
-
ChatGPT 推出了全新的个性化用户自定义指令功能,用户现在可以根据自己的需求来设置 GPT 的 “性格”。这一功能的上线,使得 ChatGPT 能够根据用户的设定进行更为个性化的回复,包括语气、个性、思考方式等方面。用户...
-
随着 Android 用户数量突破30亿,谷歌在保护用户安全方面的压力与日俱增。为了应对日益猖獗的网络攻击,谷歌宣布加大对人工智能(AI)的投入,以提升恶意软件检测能力、加强隐私保护措施,并为开发者提供更完善的工具。通过这些...
-
Adobe 近日宣布,其最新的 Firefly AI 视频生成器正式进入公测阶段,让用户能够将文本和图像转化为短视频。这项创新功能集成在 Adobe 的 Creative Cloud 中,使得创作者能够在熟悉的工具中轻松生成...
-
谷歌 DeepMind 团队正式推出了 WebLI-100B 数据集,这是一个包含1000亿个图像 - 文本对的庞大数据集,旨在增强人工智能视觉语言模型的文化多样性和多语言性。通过这一数据集,研究人员希望改善视觉语言模型在不...
-
美国半导体初创公司 EnCharge AI 最近宣布完成了一轮超过1亿美元的 B 轮融资,此次融资由老虎全球(Tiger Global)领投。该公司专注于开发用于人工智能(AI 应用的模拟内存芯片,致力于提高 AI 处理的速...
-
百川智能今日宣布,其与北京儿童医院及小儿方健康科技(北京)有限公司联合研发的“AI儿科医生”在经过近一个月的内测并得到专家认可后,正式投入临床应用。这一里程碑式的进展标志着AI技术在医疗领域的深度应用迈出了重要一步。图源备注...