chatgpt图片识别、生成图片、语音对话多模态深度试玩
  fM37ioSRdDbf 2023年11月02日 18 0


  1. 大模型替代人的工作的能力,越来越明显了。最近chatgpt支持多模态了,看这大佬们玩的不易乐乎,手痒也想试一试,因此有给openai上供了20刀。
  1. 另外我是gpt的拥护者,但是周围的同事有对此担忧,因为他们长期积累的技能可能一下子没了门槛。
  2. 在工作中我已经充分使用了这些工具,此时我仿佛拥有了一个小团队,我提出思路和方案,苦活累活、无意义的重复劳动交给gpt。这样我可以有更多的学习最新的研究、更重要的技能。

1 图生图

1.1 操作方式

打开new bing,切换创意模式,上传图片,输入提示词“根据图片内容生成图画”,如果你想告诉他用什么风格,可以在提示词追加,用中国风或者皮克斯风格。

chatgpt图片识别、生成图片、语音对话多模态深度试玩_生成图片

1.2 观看效果

我把娃娃的手绘上传到new bing(接入的是dalle-3模型),让它根据图片内容生成图片,下面看效果。

第一张美人鱼

chatgpt图片识别、生成图片、语音对话多模态深度试玩_上传_02

chatgpt图片识别、生成图片、语音对话多模态深度试玩_上传_03


第二张海底世界(美人鱼、章鱼、鱼)

chatgpt图片识别、生成图片、语音对话多模态深度试玩_上传_04

chatgpt图片识别、生成图片、语音对话多模态深度试玩_人工智能_05


第三张长城

由于我图片倒置了,生成了很有创意的机械龙

chatgpt图片识别、生成图片、语音对话多模态深度试玩_生成图片_06

chatgpt图片识别、生成图片、语音对话多模态深度试玩_语音识别_07


第四张画的葫芦,求子和平安

识别成鱼了,有点意外。

chatgpt图片识别、生成图片、语音对话多模态深度试玩_人工智能_08

chatgpt图片识别、生成图片、语音对话多模态深度试玩_生成图片_09

2 提示词生图

我们采用chatgpt4 DALLE-3

2.1 操作方式

前提是需要chatgpt4账号,选择dall-e3,然后输入提示词。

chatgpt图片识别、生成图片、语音对话多模态深度试玩_生成图片_10

2.1 讲述一个程序员遇到bug,熬夜加班修bug的故事

输入标题中的提示词

chatgpt图片识别、生成图片、语音对话多模态深度试玩_人工智能_11

2.2 根据古诗生成图片

chatgpt图片识别、生成图片、语音对话多模态深度试玩_生成图片_12

2.3 设计软件图标

图标在我们UI设计中很常见,话不多说,贴图

chatgpt图片识别、生成图片、语音对话多模态深度试玩_人工智能_13

2.4 设计logo和衬衫

这个难度有点大,我始终没提示好

chatgpt图片识别、生成图片、语音对话多模态深度试玩_chatgpt_14

chatgpt图片识别、生成图片、语音对话多模态深度试玩_人工智能_15

3 识别图片并提问

3.1 操作方式

苹果手机安装了chatgpt客户端,打开客户端拍照上传,并提问。

3.2 识别地图地图并提问超哪个方向

chatgpt图片识别、生成图片、语音对话多模态深度试玩_生成图片_16

3.3 分析图片公式

拍了一个泰勒展开式让它分析

chatgpt图片识别、生成图片、语音对话多模态深度试玩_语音识别_17

4 语音对话

4.1 设置开启语音

在设置speech中选择语音风格

chatgpt图片识别、生成图片、语音对话多模态深度试玩_人工智能_18

chatgpt图片识别、生成图片、语音对话多模态深度试玩_语音识别_19

4.2 体验

语音提问,语音回复,这里没法播放录音,贴出回复的内容。

chatgpt图片识别、生成图片、语音对话多模态深度试玩_chatgpt_20

chatgpt图片识别、生成图片、语音对话多模态深度试玩_上传_21

5 总结

上述的技能,总结一下叫“提示工程”(promote engineering),掌握这些很重要。所以下次在抱怨gpt不行之前,需要反问一下自己提出的问题是否清晰。
如果你想学习请按下面操作搜错资料

题外话:这里不是卖课,吴恩达是AI界的顶级科学家,免费教学推广人工智能的。



【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月08日 0

暂无评论

推荐阅读
fM37ioSRdDbf