podlm-public是一个开源AI播客工具,旨在创建一个中文版的NotebookLM替代品,专门用在将任意URL转换成播客内容,再推送到小宇宙平台。项目基于先进的AI技术,支持用户用简单的操作生成专业的播客内容。...
-
-
Augmented Physics是一个创新的教育工具,基于集成机器学习技术,将物理教科书中的静态图表转换成互动式和嵌入式的物理模拟。工具基于先进的计算机视觉技术,比如Segment Anything和多模态大型语言模型(L...
-
Adobe Firefly 是 Adobe 推出的一系列创意生成式 AI 模型,旨在帮助用户扩展其天生的创造力。这些模型集成在 Adobe 的旗舰应用程序和 Adobe Stock 中,支持的功能包括图像、矢量图形和设计模型...
-
T2V-Turbo是一种先进的文本到视频生成模型,由Google、UC Santa Barbara(加利福尼亚大学圣塔芭芭拉分校)、和University of Waterloo(滑铁卢大学)的研究人员共同推出。基于在预训练...
-
OpenR是一个由伦敦大学学院(UCL)、上海交通大学、利物浦大学、香港科技大学(广州)和西湖大学联合开源的全链条训练框架,旨在提升大型语言模型(LLM)的复杂推理能力。OpenR集成过程奖励模型(PRM)训练、强化学习、多...
-
FLUX.1-Turbo-Alpha是阿里妈妈创意团队基于FLUX.1-dev模型训练的8步蒸馏Lora模型。基于多头判别器技术,升图像生成的质量,支持文本到图像的生成及修复控制网等多种应用。模型易于使用,与Diffuser...
-
Agent S 是一个创新的代理框架,旨在基于图形用户界面(GUI)实现人机交互的自动化。Agent S 基于模拟人类的操作方式,用鼠标和键盘直接与计算机交互,处理复杂的多步骤任务。Agent S 引入经验增强的分层规划方法...
-
Gen2Act是由谷歌、卡内基梅隆大学和斯坦福大学共同推出的一种机器人操作策略,基于预测网络数据中的运动信息来生成人类视频,并将视频用在引导机器人执行新任务。策略基于大量可用的网络视频数据,避免直接生成机器人视频的复杂性。...
-
Loong是由香港大学和字节跳动联合推出的一种新型长视频生成模型,能生成外观一致、动态丰富、场景过渡自然的分钟级长视频。模型基于自回归大型语言模型(LLM),将文本和视频信息整合为统一序列,用渐进式短到长训练方案与损失重新加...
-
Illuminate 是一个由谷歌开发的项目,能将学术论文转化为人工智能生成的音频讨论。项目基于谷歌强大的语言模型 Gemini,将论文内容转换成引人入胜的对话,使用户能在运动、开车等碎片时间里轻松学习。...