今天让我们一起来看看智谱清言最近发布的一些好玩大模型和功能。
是否还记得,OpenAI发布GPT-4o时,让我们小兴奋了一下。它可以让用户与AI进行实时的视频通话,实现类似真人的交互体验。也就是,用户通过实时音视频进行交流,获取所需的内容。
这个功能应用还是比较广泛,如教育辅导、实时翻译、语言学习、客户服务、远程工作协作、健康咨询、娱乐互动、生活助手、编程助手等等。当然也可以用于算命等互联网之前做过的项目,重做一遍。
但GPT-4o用起来不方便。
上周,智谱AI也发布了视频通话功能,是通过智谱清言App实现的,允许用户与AI进行实时的视频交互。这功能是国内首发,建议铁子们申请使用(目前是内测阶段)。
智谱清言App的视频通话功能具有跨文本、音频和视频进行实时推理的能力,例如将摄像头对准试卷并圈出题目请求解答,AI能够实时识别并给出相应解答。此外,AI可以进行流畅的通话,用户可以实时打断AI,AI能够迅速反应并理解对话当前的环境,包括人物状态和背景环境,与GPT-4o类似。
智谱清言除了发布这个功能之外,还一口气发布了GLM-V-Plus、GLM-4V-Plus、CogView-3-Plus、GLM-4-Flash、GLM-4-Long等大模型。
这些大模型已在bigmodel.cn开放,可调用,新注册的开发者赠送一些资源包,也可以在线测试使用。
接下来,我们一起来体验一下。
注册比较简单,手机号注册,然后进行实名认证,系统就会自动送资源包。
GLM-4-PLUS大模型的体验。
可以对话聊天、写作、生成代码等,还是挺好用。
GLM-4V-PLUS大模型的体验。
这个大模型主要是理解视频内容,如果想理解图片内容,可以用智谱清言,上传图片,然后描述语言就可以。
CogView-3-Plus大模型的体验。
这个大模型是文生图,目前个人感觉这个大模型没有很惊艳,文生图已经很成熟了。
?GLM-4-Flash大模型的体验。
这个大模型是免费的。主要擅长数学逻辑、逻辑推理、代码执行以及广泛知识覆盖等。
GLM-4-LONG大模型的体验。
这个主要是拥有更强的基础能力和更长的上下文处理能力,这个大模型无法读取链接,有点可惜。
另外,智谱清言还开源了清影的大模型,即视频生成模型 CogVideoX的5B版本。
看着智谱清言的这些产品发布,感觉到国内的大模型发展速度真快,已经可以达到95%的ChatGPT-4大模型。