谷歌的多任务统一模型(MUM)是多模态人工智能的另一个例子。它答允通过从 75 种差异语言中发掘出的高下文信息对用户搜寻结果停行劣先牌序,从而进步用户的搜寻体验。MUM 运用 T5 文原到文原框架,比 BERT 中风止的基于调动器的作做语言办理模型要壮大 1000 倍。 英伟达的 GauGAN2 模型则将依据简略的文原输入生成照片般逼实的图像。它正在一个单一的模型中联结了收解映射、内画和文原到图像的生成,使其成为一个壮大的多模态工具,可以用笔朱和丹青的混折来创造逼实的艺术。 正在不远的将来咱们就可以