AI工具 - 第12页 - 中国AI网

DrivingDojo 中科院联合美团推出的交互式驾驶世界模型数据集

54

DrivingDojo是中国科学院自动化研究所与美团无人车团队合作推出的数据集，用在训练和研究复杂的自动驾驶交互式世界模型。数据集包含18,000个视频片段，覆盖完整的驾驶操作、多智能体交互以及丰富的开放世界驾驶知识，为开发...

50

EXAONE 3.5是LG AI研究院推出的开源AI模型，包含24亿、78亿和320亿参数的三个版本。EXAONE 3.5擅长长文本处理，在基准测试中表现优异，特别是在实际应用、长文本处理和数学方面。模型采用检索增强生成技术...

52

FineWeb 2是Hugging Face推出的多语言预训练数据集，覆盖超过1000种语言。FineWeb 2基于定制化的数据管道处理，包括语言识别、去重、内容过滤和PII匿名化，适应不同语言的特点。FineWeb 2数据...

48

Director是构建视频智能体的框架，用户能用自然语言命令执行复杂的视频任务，如视频搜索、编辑、合成和生成，并能即时流式传输结果。基于VideoDB的“视频即数据”基础设施，Director集成多个预构建的视频代理和AI...

47

DeepSeek-V2.5-1210是DeepSeek 推出的 DeepSeek V2 系列收官AI模型，DeepSeek V2.5 的最终版微调模型。模型基于Post-Training迭代，在数学、编程、写作和角色扮演等方...

43

ClotheDreamer是上海大学、上海交通大学、复旦大学和腾讯优图实验室共同推出的3D服装生成技术，能根据文本描述生成高保真、可穿戴的3D服装资产。ClotheDreamer用3D高斯为基础，基于Disentangled...

59

易健EasyHealth是北京大学健康传播专业师生推出的微信小程序，基于大语言模型技术打造的健康科普智能问答系统。程序提供AI智能问答、情感智能算法、健康档案管理、健康数据分析和个性化健康咨询等功能，帮助用户根据个人健康状况...

66

VISION XL是高效的视频修复和超分辨率工具，基于潜在扩散模型技术，专注于解决高清视频的逆问题。工具能修复视频缺失部分、去除模糊，显著提升视频清晰度，最高可达四倍超分辨率。...

50

GenMAC是香港大学、清华大学和微软研究院推出的多代理协作的迭代框架，用在解决文本到视频生成中的复杂场景生成问题。基于将任务分解为设计、生成和重新设计三个阶段，在生成与重新设计之间建立迭代循环，逐步验证和优化视频内容。...

56

SPDL（Scalable and Performant Data Loading）是 Meta AI 推出的开源数据加载工具，能提高 AI 模型训练效率。基于多线程技术，实现高吞吐量数据加载，减少计算资源消耗。与传统基于进...