
【资料图】
周鸿祎表示,大语言模型是构建视觉大模型的基础,多模态能力增强的核心是借助了大语言模型的认知、推理、决策能力。视觉大模型是“360智脑”的重要能力组成,使其能看懂图片,未来看懂视频、听懂声音。周鸿祎认为,目前大模型的能力主要体现在软件层,接入智能硬件后,会让大模型的能力从数字世界走向物理世界。
关键词:
【资料图】
周鸿祎表示,大语言模型是构建视觉大模型的基础,多模态能力增强的核心是借助了大语言模型的认知、推理、决策能力。视觉大模型是“360智脑”的重要能力组成,使其能看懂图片,未来看懂视频、听懂声音。周鸿祎认为,目前大模型的能力主要体现在软件层,接入智能硬件后,会让大模型的能力从数字世界走向物理世界。
关键词: