2024-06-01 |
Claude 3全系支持函数调用工具Tool use 可与外部系统进行交互 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-06-01 |
提高Transformer模型处理复杂算术任务的能力的方法 |
AI 项目 ‧ 小互 |
|
2024-06-01 |
接近生产级别的的3D生成模型 Rodin Gen-1 正式上发布 |
AI 工具 ‧ 小互 |
|
2024-06-01 |
ElevenLabs推出新的 AI 音频模型 能够根据文本生成各种音效和声音 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-06-01 |
Consistent Character:保持角色一致性的同时 生成给定角色的不同姿势图像 |
AI 工具 ‧ 小互 |
|
2024-06-01 |
AI和脑机接口帮助失语症患者恢复双语交流 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-31 |
Sonic:基于状态空间模型的低延迟实时推理语音生成模型 |
AI 项目 ‧ 小互 |
|
2024-05-31 |
Jina AI Reader 工具能够从任意 URL 读取 PDF 文件 并快速解析成文本 |
AI 工具 ‧ 小互 |
|
2024-05-31 |
ToonCrafter:自动生成卡通动画的中间帧 并根据参考图像对草图自动上色 |
AI 项目 ‧ 小互 |
|
2024-05-31 |
Perplexity AI推出可以将你的答案一键生成博客、文章的工具:Perplexity Pages |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-31 |
OpenAI 推出 ChatGPT Edu 为大学设计的专用版本 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-30 |
V-Express:根据单张个人照片生成视频 并能通过多种信号控制视频内容 |
AI 项目 ‧ 小互 |
|
2024-05-30 |
ViViD:视频虚拟试穿技术 可以随意替换视频中人物的衣服 |
AI 项目 ‧ 小互 |
|
2024-05-30 |
Udio推出新的udio-130音乐生成模型和更多高级功能 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-29 |
Apten:AI 驱动的短信助手 让AI通过短信和你的客户进行交流 |
AI 工具 ‧ 小互 |
|
2024-05-29 |
Khoj:一个开源的个人化AI 助手 能连接你的在线和本地文档 充当你的第二大脑 |
AI 工具 ‧ 小互 |
|
2024-05-29 |
Llama3-V:500美元的成本构建的基于 Llama3 的多模态模型 性能与GPT-4V相当 |
AI 项目 ‧ 小互 |
|
2024-05-29 |
ChatTTS:专门为对话场景设计的文本到语音TTS模型,支持中英文 |
AI 工具 ‧ 小互 |
|
2024-05-28 |
StreamV2V:实时视频转换的工具 可以进行视频实时换脸和风格转换 |
AI 工具 ‧ 小互 |
|
2024-05-28 |
SignLLM :世界上第一个通过文字描述生成手语视频的多语言手语模型 |
AI 项目 ‧ 小互 |
|
2024-05-27 |
Look Once to Hear:全新的降噪耳机 只需注视对方即可放大或者消除对方声音 |
AI 项目 ‧ 小互 |
|
2024-05-27 |
ReVideo:允许用户对视频特定区域和视频对象的运动轨迹进行精确编辑 |
AI 项目 ‧ 小互 |
|
2024-05-27 |
Canva推出了一系列新功能和工具 16 项重要更新介绍 |
AI 工具 ‧ 小互 |
|
2024-05-27 |
LlamaFS:基于Llama 3的能自动帮你分类整理电脑里文件的工具 |
AI 工具 ‧ 小互 |
|
2024-05-27 |
Stability AI 推出Stable Assistant 聊天机器人 能聊天能生图能出视频 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-27 |
如何将自己融入到一幅 Midjourney 生成的图片中,并使其动画化 |
AI 教程 ‧ 小互 |
|
2024-05-26 |
Responder 无人机 对接911报警系统 可70秒抵达案发现场实时监控 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-26 |
Flawless:利用AI创建 与原版电影一样沉浸和真实的唇形同步配音版本 |
AI 工具 ‧ 小互 |
|
2024-05-25 |
YOLO v10:毫秒级实时的端到端目标检测开源模型 |
AI 项目 ‧ 小互 |
|
2024-05-25 |
RAGApp:无需编写代码,轻松构建企业级RAG聊天机器人 |
AI 项目 ‧ 小互 |
|
2024-05-24 |
OpenAI 开发人员体验主管VivaTech展示GPT-4o和Sora结合的能力 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-24 |
Pandora:能够根据自然语言指令生成视频 并能实时进行视频控制的通用世界模型 |
AI 项目 ‧ 小互 |
|
2024-05-23 |
Google推出 LearnLM 教育模型工具 专门用于提升教育和学习体验 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-23 |
Model Explorer:Google开放能理解和调试优化大语言模型的图形可视化工具 |
AI 工具 ‧ 小互 |
|
2024-05-23 |
使用 ChatGPT 像专业人类分析师一样 进行财务报表分析 |
AI 工具 ‧ 小互 |
|
2024-05-23 |
Truecaller 与微软合作 允许用户克隆自己的声音 来让AI接听电话 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-23 |
Dolphin Mixtral 1x22b:去除对齐和偏见 没有任何审查和道德限制的模型 |
AI 项目 ‧ 小互 |
|
2024-05-23 |
微软推出新版 Power Automate 通过语音命令和演示教会 AI帮你自动化干活 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-23 |
SpeechVerse:通用音频语言模型 可进行自动语音识别、语音翻译、情感识别 |
AI 论文 ‧ 小互 |
|
2024-05-22 |
TRANSAGENTS: 一个专门用于进行文学翻译的多智能体虚拟翻译出版公司 |
AI 论文 ‧ 小互 |
|
2024-05-22 |
百川智能发布 Baichuan 4模型及首款AI智能助手“百小应” 可联网搜索 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-22 |
Anthropic 的研究人员发现了打开AI模型“黑盒子”的方法 |
AI 论文 ‧ 小互 |
|
2024-05-22 |
LearnLM-Tutor:DeepMind 开发 专门用于一对一的教学辅导的 AI 模型 |
AI 论文 ‧ 小互 |
|
2024-05-22 |
Chameleon:能同时理解和生成文本与图像混合模态模型 |
AI 论文 ‧ 小互 |
|
2024-05-22 |
Perplexity 与 TakoViz 合作推出高级知识搜索和可视化功能 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-22 |
2024Microsoft Build大会超全纪录 新的Phi-3多模态模型、Copilot Agents |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-21 |
使用AI工具创建完整漫画教程 包括保持角色一致和文字添加 |
AI 教程 ‧ 小互 |
|
2024-05-21 |
生成漫画书页面模式的漫画图像 轻松制作漫画小说 |
AI 教程 ‧ 小互 |
|
2024-05-21 |
微软CEO 纳德拉谈新款 Windows AI Copilot+ PC 如何击败苹果 Mac |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-21 |
微软发布最强 AI 电脑:Copilot+ PC 能听、能看、能说 而且能记住你一切 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-21 |
微软推出 Recall 功能 它能记住你在电脑上进行的一切操作和信息 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-20 |
Prompt 学习地图 28 | 理论&实践 – 让模型自己评价提示词的设计缺陷,提出优化方案 |
AI 课程 ‧ 小七姐 |
|
2024-05-20 |
Prompt 学习地图 27 | 理论&实践 – Meta Prompts 用提示词设计提示词 |
AI 课程 ‧ 小七姐 |
|
2024-05-20 |
Prompt 学习地图 29 | 国产大模型及提示词适配 |
AI 课程 ‧ 小七姐 |
|
2024-05-20 |
Apriora:人工智能驱动的面试平台 实时进行视频面试 能检测作弊行为 |
AI 工具 ‧ 小互 |
|
2024-05-19 |
装备AI瞄准步枪的机器狗 接受了美国海军陆战队特种作战评估 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-19 |
PictoGraphic:拥有超过40000张的免费AI生成插图库 |
AI 工具 ‧ 小互 |
|
2024-05-19 |
无需专业技能 从文本生成高质量可编辑的矢量图形和动画 |
AI 项目 ‧ 小互 |
|
2024-05-18 |
Gemini 1.5 Pro和Gemini 1.5 Flash 150页技术报告 |
AI 资源 ‧ 小互 |
|
2024-05-18 |
ElevenLabs 推出 Audio Native 自动将你的内容转换为播客 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-18 |
CAT3D:1分钟从任意数量的图像生成一致的高质量3D新视图 |
AI 项目 ‧ 小互 |
|
2024-05-17 |
李飞飞:借助空间智能,人工智能将了解真实世界 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-17 |
ZeST:将一个图像中物体材料提取并转移到另一个图像的目标对象上 |
AI 项目 ‧ 小互 |
|
2024-05-17 |
GPT-4o官方演示的16个完整视频中文翻译 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-17 |
Google Veo详细介绍:可与 Sora 竞争的高清 AI 视频生成器 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-17 |
ChatGPT 改进数据分析功能 可以与数据表格进行实时交互 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-16 |
Project Astra详细介绍:Google的全能AI助手 能听、能看并能实时回答任何问题 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-16 |
Google升级Gemini 1.5 Pro和即将推出新的 Gemini 1.5 Flash 模型以及Gemma 2 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-16 |
Google将推出Ask Photos 用户能够通过自然语言搜索本机里照片和视频 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-16 |
Google推出开源视觉语言模型:PaliGemma 支持图像视频等多种视觉语言任务 |
AI 项目 ‧ 小互 |
|
2024-05-16 |
苹果宣布一些列新的辅助功能,包括眼动追踪、语音快捷方式等 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-16 |
腾讯混元DiT模型 支持中英双语生成高分辨率、高质量的图像 |
AI 项目 ‧ 小互 |
|
2024-05-15 |
Google在其搜索中集成先进的 Gemini 模型 更新一些列功能 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-14 |
OpenAI 发布 GPT-4o全能模型 实时语音和视觉能力 再次刷新业界 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-14 |
RAFT: 可以显著提升提高LLMs在RAG方面的能力的方法 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-13 |
VimTS:自动识别图像或视频序中的文本信息并精确提取内容 |
AI 项目 ‧ 小互 |
|
2024-05-13 |
宇树科技发布 Unitree G1 人形机器人 售价9.9万元 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-13 |
Refuel LLM-2:专门为数据标注、清洗设计的开源语言模型 |
AI 项目 ‧ 小互 |
|
2024-05-12 |
FunClip :阿里巴巴开源的一款视频自动化视频剪辑工具 |
AI 工具 ‧ 小互 |
|
2024-05-12 |
Google开发了一种名为TimesFM的时间序列预测模型 可预测未来 |
AI 项目 ‧ 小互 |
|
2024-05-11 |
RayDINO :能够对胸部X光片进行全面分析并识别常见疾病的视觉模型 |
AI 论文 ‧ 小互 |
|
2024-05-11 |
AniTalker:一张照片和输入音频生成生动的能说话的面部视频 |
AI 项目 ‧ 小互 |
|
2024-05-11 |
Llama3 中文综合资源库 集合了与Llama3 模型相关的各种中文资料 |
AI 资源 ‧ 小互 |
|
2024-05-11 |
Meta AI最新研究:通过同时预测多个未来标记 提升模型推理速度和性能 |
AI 论文 ‧ 小互 |
|
2024-05-10 |
将 Gemma 2B 的上下文窗口扩展到 1000万的技术方法 |
AI 论文 ‧ 小互 |
|
2024-05-10 |
Perplexity 与 SoundHound AI 合作 为汽车带来在线智能语音助手 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-10 |
Stylar:最可控的人工智能图像和设计工具 附操作教程 |
AI 工具 ‧ 小互 |
|
2024-05-10 |
ElevenLabs 推出音乐生成模型 ElevenLabs Music 可直接通过文本提示生成完整音乐 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-10 |
Stability AI 推出了Stable Artisan 可以在Discord上进行图像生成与编辑 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-09 |
Krea AI推出一款结合关键帧和文本提示的视频生成工具 Krea Video |
AI 工具 ‧ 小互 |
|
2024-05-09 |
Neuralink 公布其脑机接口项目进展报告 首位四肢瘫痪者重获自主能力 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-09 |
DeepMind 发布 AlphaFold 3 能够预测所有生命分子结构和相互作用的 AI 模型 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-09 |
Vidu:发布技术报告 披露技术细节 首个国产媲美Sora的视频生成模型 |
AI 论文 ‧ 小互 |
|
2024-05-08 |
MistoLine:将手绘的草图直接生成符合草图轮廓的高质量图像 |
AI 工具 ‧ 小互 |
|
2024-05-08 |
德克萨斯大学开发出可拉伸的电子皮肤 可以赋予机器人人类级触感灵敏度 |
XiaoHu.AI日报 ‧ 小互 |
|
2024-05-08 |
IC-Light:图像重新照明 根据文本提示或背景图参考重新生成特定光照的图像 |
AI 项目 ‧ 小互 |
|
2024-05-08 |
Danswer:可以与自己的企业内部知识库、文档和人员连接的AI工具 |
AI 工具 ‧ 小互 |
|
2024-05-08 |
Ilus AI:一款AI插画生成器 快速生成墨线画、涂鸦等各种风格的插画 |
AI 工具 ‧ 小互 |
|
2024-05-08 |
Agent Hospital :一个完全模拟整个医院环境和流程的AI医院 |
AI 论文 ‧ 小互 |
|
2024-05-08 |
微软为美国情报机构专门定制了一个间谍版的GPT 4 |
XiaoHu.AI日报 ‧ 小互 |
|