欢迎访问广东 ‧ 东莞谍赞智能科技有限公司业务官网,咨询热线:13923452579
网站地图 工具中心
登录
当前位置:首页>技能晋升>技能技巧

智谱AI实现图片识别分析及文案内容生成对话

  • 发布时间:2024-07-03 付涛
  • 【简述:】在当今快速发展的人工智能领域,智能技术正在为我们的日常生活带来越来越多的便利与创新。其中,智谱AI作为一款先进的人工智能服务平台,不仅仅能够进行文本生成和对话处理,更能结合先进的视觉识别技术,实现对图片的深度分析与内容生成。本文将探讨智谱AI如何利用其强大的技术实现图片识别分析,
  • 二维码
    手机扫码分享好友

        在当今快速发展的人工智能领域,智能技术正在为我们的日常生活带来越来越多的便利与创新。其中,智谱AI作为一款先进的人工智能服务平台,不仅仅能够进行文本生成和对话处理,更能结合先进的视觉识别技术,实现对图片的深度分析与内容生成。本文将探讨智谱AI如何利用其强大的技术实现图片识别分析,并结合文本生成功能,为用户带来全新的智能交互体验。

    智谱AI通过结合先进的自然语言处理和计算机视觉技术,能够实现对复杂场景中图片内容的准确识别和分析。当用户向智谱AI提出带有图片的问题时,它不仅能理解用户的文字描述,还能从图片中提取关键信息,进而生成相关的语义内容。这一过程背后涵盖了深度学习模型和大数据处理技术的应用,使得智谱AI在处理复杂多变的实际场景时表现出色。

    通过智谱AI的技术,用户可以通过简单的对话界面上传图片并提出问题,比如“这张图片中的主要物体是什么?”或者“基于这张图片,能否生成一个相关的广告文案?”智谱AI会综合分析图片内容,结合语义理解能力生成相应的答案或文本。这种结合视觉识别和文本生成的综合能力,不仅提升了用户的交互体验,还在商业应用中展现了广泛的潜力。

    下面我们来看一下在工作里面如何接入智谱AI来满足两个方面的工作:智谱AI实现图片识别分析      及     文案内容生成对话


    第一步、注册智谱AI账号

    打开智谱AI开放平台:智谱AI开放平台 (bigmodel.cn),然后进行注册;

    微信截图_20240703101046 (1).png

    第二步、并完成实名认证

    进入实名认证中心完成认证,领取大模型赠送额度:实名认证中心_智谱AI开放平台 (bigmodel.cn)

    微信截图_20240703101046 (1) (1).png


    第三步、获取智谱API keys

    直接打开网址进入API管理中心:API管理_智谱AI开放平台 (bigmodel.cn)

    微信截图_20240703101046 (1).png

    在上述截图里面有默认的API,可以直接复制使用,也可以新创建API使用,都没有问题;


    第四步、图片识别PYTHON测试代码

    直接复制以下代码创建PYTHON执行文件,或者影刀客户端使用:

    from zhipuai import ZhipuAI
    def query_zhipuai(question, image_url):
        """
        用问题和图片链接地址查询智能拍AI。
        :param question: 您想要提问的文本问题。
        :param image_url: 与您问题相关的图片的URL。
        :return: 智能拍AI的响应。
        """
        # 在此处填入您的 API 密钥
        api_key = "9978ce7165d35eee9********a9682e.R2aFaKAh4PqiZPMZ"
        client = ZhipuAI(api_key=api_key)
        response = client.chat.completions.create(
            model="glm-4v",  # 模型名称
            messages=[
                {
                    "role": "user",
                    "content": [
                        {"type": "text", "text": question},
                        {"type": "image_url", "image_url": {"url": image_url}}  # 更新后的图片链接
                    ]
                }
            ]
        )
        return response.choices[0].message.content
    # 更新后的图片链接地址
    image_url = "https://i0.hdslb.com/bfs/face/49155e68a6271ee9f2129ae4318a59454841ca5b.jpg"
    question = "基于这张图片的色调风格,请生成一个相关的广告文案?"
    # 调用函数并获取智能拍AI的响应
    response_content = query_zhipuai(question, image_url)
    # 输出响应内容(示例)
    print(response_content)


    上述代码说明:

    1、api_key:即为从平台里面复制出来的API;

    2、image_url:这里默认为网络远程图片,支持HTTP与HTTPS;

    3、question:即为需要对图片进行分析的文本提示词;

    实施效果图如下:

    微信截图_20240703101046 (2).png

    第五步、智谱AI大模型文字对话内容生成

    直接复制以下代码创建PYTHON执行文件,或者影刀客户端使用:

    from zhipuai import ZhipuAI
    # 在此处填入您的 API 密钥
    api_key = "9978ce7165d35eee9********a9682e.R2aFaKAh4PqiZPMZ"
    def ask_glm4(question):
        # 创建 ZhipuAI 客户端
        client = ZhipuAI(api_key=api_key)    
        # 构造用户的输入消息
        messages = [{"role": "user", "content": question}]    
        # 向 Zhipu AI 发送请求并获取回复
        response = client.chat.completions.create(
            model="glm-4",
            messages=messages,
            stream=False
        )
        # 提取回复的内容并返回
        return response.choices[0].message.content
    # 示例:用户输入问题并获取回复
    user_question = "你是谁"
    answer = ask_glm4(user_question)
    print("智谱AI的回答:", answer)

    上述代码说明:

    1、api_key:即为从平台里面复制出来的API;

    2、user_question:这里即为用户输入提问的提示词;

    3、question:即为需要对图片进行分析的文本提示词;

    实施效果图如下:

    微信截图_20240703101046 (1).png


    关于智谱AI调用常见问题:

    问、运行中如果出现 cannot import name 'Literal' from 'typing' 报错?

    答:当前电脑PY环境中所部署的PYTHON版本低于3.8,检测电脑PY版本指令如下:

    import sys
    print(sys.version)

    问:API 使用受到并发数(在途请求任务数量)的限制?

    答:关API 使用受到并发数(在途请求任务数量)的限制。下面为您当前各个模型的速率限制情况,您可以访问 速率限制指南 了解更多详情。https://open.bigmodel.cn/usercenter/rate-limits

    问:安装模块成功之后还显示no modle named cached property?

    答:请通过以下指令进行安装:

    pip install cached-property

    问:智谱AI目前的价格比较贵吧?

    答:具体关于接口API价格可以查阅一下:API产品价_格智谱AI开放平台 (bigmodel.cn)

    RPA应用推荐浏览

    内容链接:https://www.diebaoyun.com/jinengjiqiao/768.html
    内容标题:智谱AI实现图片识别分析及文案内容生成对话
    内容版权:当前文章由【付涛】本人原创开发与文案内容写作,内容版权归当前平台所有,如需转载,请务必注明来源,谢谢合作!
    本文最后更新发布于【2024-07-03】,某些文章具有时效性,若有错误或已失效,请在联系客服
    争议处理:针对本站内容若有异义,亦可直接与【法律顾问:易兴俊,律师联系电话:13825799821】直接联系沟通;
  • 当前文章TAGS标签:
  • 上一篇:PYTHON使用ITCHAT库操作微信行为时出现AttributeError: 'HTMLParser' object has no attribute 'unescap下一篇:EasyBR极简指纹浏览器(ebrower)如何使用影刀RPA来实现流程自动化操作