在当今快速发展的人工智能领域,智能技术正在为我们的日常生活带来越来越多的便利与创新。其中,智谱AI作为一款先进的人工智能服务平台,不仅仅能够进行文本生成和对话处理,更能结合先进的视觉识别技术,实现对图片的深度分析与内容生成。本文将探讨智谱AI如何利用其强大的技术实现图片识别分析,并结合文本生成功能,为用户带来全新的智能交互体验。
智谱AI通过结合先进的自然语言处理和计算机视觉技术,能够实现对复杂场景中图片内容的准确识别和分析。当用户向智谱AI提出带有图片的问题时,它不仅能理解用户的文字描述,还能从图片中提取关键信息,进而生成相关的语义内容。这一过程背后涵盖了深度学习模型和大数据处理技术的应用,使得智谱AI在处理复杂多变的实际场景时表现出色。
通过智谱AI的技术,用户可以通过简单的对话界面上传图片并提出问题,比如“这张图片中的主要物体是什么?”或者“基于这张图片,能否生成一个相关的广告文案?”智谱AI会综合分析图片内容,结合语义理解能力生成相应的答案或文本。这种结合视觉识别和文本生成的综合能力,不仅提升了用户的交互体验,还在商业应用中展现了广泛的潜力。
下面我们来看一下在工作里面如何接入智谱AI来满足两个方面的工作:智谱AI实现图片识别分析 及 文案内容生成对话
第一步、注册智谱AI账号
打开智谱AI开放平台:智谱AI开放平台 (bigmodel.cn),然后进行注册;
第二步、并完成实名认证
进入实名认证中心完成认证,领取大模型赠送额度:实名认证中心_智谱AI开放平台 (bigmodel.cn)
第三步、获取智谱API keys
直接打开网址进入API管理中心:API管理_智谱AI开放平台 (bigmodel.cn)
在上述截图里面有默认的API,可以直接复制使用,也可以新创建API使用,都没有问题;
第四步、图片识别PYTHON测试代码
直接复制以下代码创建PYTHON执行文件,或者影刀客户端使用:
from zhipuai import ZhipuAI def query_zhipuai(question, image_url): """ 用问题和图片链接地址查询智能拍AI。 :param question: 您想要提问的文本问题。 :param image_url: 与您问题相关的图片的URL。 :return: 智能拍AI的响应。 """ # 在此处填入您的 API 密钥 api_key = "9978ce7165d35eee9********a9682e.R2aFaKAh4PqiZPMZ" client = ZhipuAI(api_key=api_key) response = client.chat.completions.create( model="glm-4v", # 模型名称 messages=[ { "role": "user", "content": [ {"type": "text", "text": question}, {"type": "image_url", "image_url": {"url": image_url}} # 更新后的图片链接 ] } ] ) return response.choices[0].message.content # 更新后的图片链接地址 image_url = "https://i0.hdslb.com/bfs/face/49155e68a6271ee9f2129ae4318a59454841ca5b.jpg" question = "基于这张图片的色调风格,请生成一个相关的广告文案?" # 调用函数并获取智能拍AI的响应 response_content = query_zhipuai(question, image_url) # 输出响应内容(示例) print(response_content)
上述代码说明:
1、api_key:即为从平台里面复制出来的API;
2、image_url:这里默认为网络远程图片,支持HTTP与HTTPS;
3、question:即为需要对图片进行分析的文本提示词;
实施效果图如下:
第五步、智谱AI大模型文字对话内容生成
直接复制以下代码创建PYTHON执行文件,或者影刀客户端使用:
from zhipuai import ZhipuAI # 在此处填入您的 API 密钥 api_key = "9978ce7165d35eee9********a9682e.R2aFaKAh4PqiZPMZ" def ask_glm4(question): # 创建 ZhipuAI 客户端 client = ZhipuAI(api_key=api_key) # 构造用户的输入消息 messages = [{"role": "user", "content": question}] # 向 Zhipu AI 发送请求并获取回复 response = client.chat.completions.create( model="glm-4", messages=messages, stream=False ) # 提取回复的内容并返回 return response.choices[0].message.content # 示例:用户输入问题并获取回复 user_question = "你是谁" answer = ask_glm4(user_question) print("智谱AI的回答:", answer)
上述代码说明:
1、api_key:即为从平台里面复制出来的API;
2、user_question:这里即为用户输入提问的提示词;
3、question:即为需要对图片进行分析的文本提示词;
实施效果图如下:
关于智谱AI调用常见问题:
问、运行中如果出现 cannot import name 'Literal' from 'typing' 报错?
答:当前电脑PY环境中所部署的PYTHON版本低于3.8,检测电脑PY版本指令如下:
import sys print(sys.version)
问:API 使用受到并发数(在途请求任务数量)的限制?
答:关API 使用受到并发数(在途请求任务数量)的限制。下面为您当前各个模型的速率限制情况,您可以访问 速率限制指南 了解更多详情。https://open.bigmodel.cn/usercenter/rate-limits
问:安装模块成功之后还显示no modle named cached property?
答:请通过以下指令进行安装:
pip install cached-property
问:智谱AI目前的价格比较贵吧?
答:具体关于接口API价格可以查阅一下:API产品价_格智谱AI开放平台 (bigmodel.cn)
【2024-07-03】
,某些文章具有时效性,若有错误或已失效,请在联系客服