导读:今天首席CTO笔记来给各位分享关于人工智能GPTs什么意思的相关内容,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!
人工智能生成的合成媒体,DeepFake 了解一下
ITDaily AI 中国
每日最新 IT 圈 AI 圈新鲜事吐槽 给你想看的
想象一下,在选举前几天,一个候选人的视频被发布,显示他们使用仇恨言论,种族污蔑,以及削弱他们作为亲少数族裔的形象。想象一下,一个十几岁的孩子看着一段令人尴尬的露骨视频在社交媒体上传播。想象一下,一个CEO在筹集资金的路上,当一段陈述她对产品的恐惧和焦虑的音频片段被发送给投资人时,毁掉了她成功的机会。
以上所有的场景都是假的、编造的,并不是真实的,但可以通过人工智能生成的合成媒体,也就是所谓的DeepFake[1],使之成为现实。同样的技术,可以让一位因卢伽雷氏病而失声的母亲用合成语音与家人对话,也可以用来生成政治候选人的假演讲,以损害其名誉。同样的技术,可以让老师使用合成视频与学生进行有效的互动,也可以用来制作一个青少年的假视频来损害其声誉。
人工智能(AI)和云计算技术、GPU虚拟机和平台服务的进步,使得音频、视频和图像处理技术的复杂性得到了快速发展。商品化云计算的接入、公共研究的人工智能算法,以及丰富的数据和多样化海量媒体的可用性,为合成媒体的创作民主化创造了一场完美的风暴。这种人工智能生成的合成媒体被称为深层假造。通过社交平台,合成媒体的传播实现了规模化的民主化。
GAN技术的创新和研究,加上计算的日益普及,使得合成数据的质量以惊人的速度提高。新的工具,其中许多是公开的,可以以越来越可信的方式操纵媒体,例如创建一个公众人物的声音副本或将一个人的脸叠加到另一个人的身体上。GAN和deepfakes已经从研究和学术课题发展到企业创新、 娱乐 和参与 社会 活动的实际应用。
Cheapfake是通过简单的常规编辑技术,如加速、减速、剪切等,以及非技术性的操作,如重新编排或重构现有媒体。廉价伪造的一个例子是 "醉酒的佩洛西 "视频[2]。最近,我们看到一些政治广告中使用了重新着色和修饰的手法,这也是一种廉价的假货[3]。
Deepfakes已经成为换脸和对口型的代名词。还有很多其他类型的基于人工智能的音频、视频和图像的操作都可以被称为Deepfakes。
换脸是指一个人的脸被另一个人的脸或另一张脸的关键特征所取代或重构。脸部交换或用滤镜进行操作,几乎是所有社交媒体、视频聊天应用的常见功能。从2014年开始,社交媒体应用Snapchat就有了增强人脸的滤镜。利用人脸检测镜头技术,你可以让自己变老,添加美颜滤镜,或者给自己装上猫耳朵和胡须。这些应用和技术的输出将被定性为AI-Generated合成媒体或deepfakes。大量的免费和付费应用和在线工具让两个人的换脸变得超级简单。开发者可以使用GitHub上的Faceswap和DeepFaceLab的开源代码来创建非常复杂的deepfakes,并在定制代码和训练AI模型方面做出一些努力。
操控术是用人工智能渲染操纵的全身动作和行为。它是一种在视频中创建目标脸部和身体的3D模型来作为木偶人的行为和说的技术。它也被称为全身深度假动作。2018年8月,加州大学伯克利分校发表了一篇名为《Everybody Dance Now》的论文[4]。这是研究人工智能如何将专业舞者的动作转移到业余爱好者的身上。日本人工智能公司Data Grid创造了一个AI引擎,可以自动生成广告和 时尚 的虚拟模型。
唇语同步是一种渲染嘴部动作和面部表情的技术,让目标人物用声音和正确的语气和音调说事情。AI算法可以将一个人说话的现有视频,改变视频中的唇部动作,以匹配新的音频。这些音频可能是断章取义的旧讲话,也可能是模仿者说话或合成的讲话。演员和导演乔丹-皮尔就用这种技术制作了奥巴马的病毒视频。
Voice Coning是一种深度学习的算法,它可以接收个人的语音记录,生成与原声过分相似的合成语音。它是一种创建个人的自定义语音字库,然后用字库来生成语音的技术。开发合成语音的应用和云服务有很多,微软定制语音、Lyrebird AI、iSpeech和VOCALiD,个人和企业都可以使用这样的技术来提高自己的机构。
图像生成或图像合成是一种利用计算机视觉技术、深度学习和生成式对抗网络(GANs)来合成新图像的技术。它可以生成计算机生成的人或任何非真实物体的图像。英伟达的一个团队用从Flickr上提取的人脸图片训练了一台计算机,创建了网站ThisPersonDoesnotExist.com。在网站ThisXDoesnotExist.com上还有其他例子。
文本生成是利用人工智能技术进行文本和深度学习,自动生成文本,写故事、散文和诗歌,创建长文档的摘要,以及综合的方法。使用RNN(循环神经网络)和现在的GANs,文本生成有很多实际的使用案例。文本生成可以帮助行业中新的自动化新闻或机器人新闻工作。OpenAI的GPT-3可以生成任何文本,包括吉他标签或计算机代码。
技术能够增强人们的能力,是一个很好的推动力。技术可以让人们有话语权,有目标,有能力大规模、快速地产生影响。由于数据科学和人工智能的进步,出现了新的赋能理念和能力。人工智能合成媒体有很多积极的应用案例。技术可以为所有人创造可能性和机会,不管他们是谁,也不管他们如何听、如何说、如何沟通。深假技术的进步在某些领域有明显的好处,比如无障碍、教育、电影制作、刑事取证和艺术表达。[我将在以后的文章中探讨积极的使用案例]。
与任何新技术一样,邪恶的行为者会利用这种创新并为他们的利益服务。GAN和Deepfakes已经不仅仅是研究课题或工程玩具。从一个创新的研究概念开始,现在它们可以作为一种通信武器使用。Deepfakes正变得容易创造,甚至更容易在政策和立法真空中传播。
Deepfakes使编造媒体--换脸、对口型和木偶人--成为可能,大多数情况下,无需同意,并给心理安全、政治稳定和商业干扰带来威胁。深度造假可以用来损害名誉、捏造证据、欺骗公众、破坏对民主体制的信任。近两年,利用生成式人工智能模型创建的合成数据被恶意使用的可能性开始引起人们的警惕。该技术现在已经发展到可能被武器化,对个人、 社会 、机构和民主制度进行破坏和伤害。Deepfakes可以促进事实相对主义,并使专制领导人得以发展。Deepfakes不仅会造成伤害,还将进一步侵蚀人们对媒体已经下降的信任。它还可以帮助公众人物将自己的不道德行为隐藏在Deepfakes和假新闻的面纱中,将他们的实际危害行为称为虚假行为,也就是所谓的骗子红利。
非国家行为者,如叛乱组织和恐怖组织,可以利用Deepfakes来代表他们的对手发表煽动性言论或从事挑衅性行动,以煽动人们的反国家情绪。例如,一个恐怖组织可以很容易地制作一个假视频,显示士兵对宗教场所的不敬,以点燃现有的反国家情绪,造成进一步的不和谐。国家可以使用类似的策略来传播针对少数族裔社区或另一个国家的计算宣传,例如,一个假视频显示一个警察高喊反宗教的污言秽语,或者一个政治活动家呼吁暴力。所有这些都可以用较少的资源、互联网规模和速度来实现,甚至可以通过微目标来激发支持。
[我将在今后的文章中探讨深层伪装的负面使用案例和危害]
为了捍卫真相和保障言论自由,我们需要采取多利益攸关方和多模式的方法。任何减轻恶意深层造假的 社会 负面影响的对策,其主要目标必须是双重的。其一,减少恶意深层造假的风险,其二,将其可能造成的损失降到最低。
恶意深造的有效对策可分为立法行动与法规、平台政策与治理、技术干预和媒介素养四大类。
笔者将在以后的文章中探讨有效的对策。
人工智能之:愿景还是危机
01
对于人工智能对人类未来的影响,大体分为两大类:乌托邦阵营和反乌托邦阵营。
在乌托邦阵营看来,我们很快能实现强人工智能,这是人类进一步拓宽智识和永生的机会。而反乌托邦阵营则表示了担忧,如果人类本身成为超级智能实现某一目标的障碍,机器可以轻易甚至无意中将人类从地球上抹去。
不过李开复老师倒认为,万能的超级人工智能在当前技术下还不可能实现。
02
实现强人工智能需要大量的人工智能基础科学的突破,以及深度学习的一连串巨大进步。而科学研究本不是易事,基础科学的突破更是难上加难。
相对于担心人类文明面临危机,李开复老更担心人工智能以另一种方式破坏经济和 社会 ,即,一场涉及工作和不平等的危机。人工智能有潜力造成更大的贫富差距、大范围的技术性失业、加剧全球经济不平衡。
03
对于人工智能会不会造成大量失业,也有两种观点。
在乐观者看来,技术可以提升人类的生产力,降低商品即服务的价格,而低价格意味着消费者的消费能力增强,这样最终会增加对人类劳动的需求。有部分工作被人工智能取代,但是也会产生相应的工作岗位,失业的这部分人可以进行工作转型。从长期来看,技术进步从未真正引起工作岗位的减少或失业率的上升。它们否定因“勒德谬误”而产生的可怕的失业预测。
但是从 历史 数据进行分析的话,情况不一定那么乐观。人类从蒸汽机、电力和信息通信技术一路走来,从一开始的蒸汽、电力时代推动生产力和就业率提高,到信息和通信技术时代的生产力提高而工资和工作岗位停滞不前或下降。所以没人能保证,提高了生产力还能为工人带来更多的工作岗位或更高的工资。
人工智能与前两次工业革命不同,它不会让少数人完成高级任务,也不会将其分解成由更多低水平技工完成的小任务,它直接取代它能胜任的工作。
(小知识:通用技术,或称GPTs,General Purpose Technologies。即“正真的技术”,能从根本上改变经济组织甚至 社会 结构,比如蒸汽机、电力、信息通信技术。“勒德谬误”,一批19世纪的英国纺织工认为机器摧毁了他们的生计从而砸毁了纺织机表示抗议,但事实上 社会 工作岗位的数量和生活质量都稳定大幅提高。)
04
与之前的工业革命推动经济转型不同的是,人工智能在三个催化剂的作用下,经济转型将变得更快。
第一个催化剂是人工智能算法的易复制性。第二个催化剂是风险投资业(VC)的诞生。第三个催化剂是中国的影响力。由于人工智能偏重于技能,应用速度快,会对就业和收入产生不利影响。那么哪些工作会受到冲击?情况有多糟?李开复老师进行了详细的分析。
越是低技能、结构化、弱社交、优化型,其越容易被取代,比如:卡车司机、洗碗工、出纳/收银、服装厂缝纫工、餐厅后厨、放射科医生(幸亏我毕业没选择去放射科)、个人信用评估、电话销售、简单翻译、核保人、税务助理等。
越是高技能、非结构化、强社交、创意或决策型等工作越不容易被取代,比如:理疗师、老人看护人、发型师、训狗师、并购专家、CEO、心理治疗师、社工市场公关总监等。
再就是,强社交,但是低技能、结构化、优化型,比如:餐厅餐饮服务、酒吧招待、豪华酒店接待、车上饮食服务、婚礼策划师、理财顾问、远程家教老师、导游(现在很多景点直接使用蓝牙耳机就可以听讲解了)、全科医生、老师等,这类工作由于社交部分使得难以完全自动化,最有可能形成人类和机器共生关系。
最后就是弱社交、但是高技能、非结构化、创意或决策型,比如:建筑工人、保安、家政人员、航空维修、出租车司机、水暖工、专栏作家、美术设计师、财务分析师、医学研究员、艺术家、科学家等,这些虽然不太依靠社交,但是是人工智能的短板,此类工作消失的速度取决于人工智能能力的实际扩展。
05
人类将面临两种失业风险:“一对一取代”和“彻底清除”。
“一对一取代”指使用人工智能取代某类工作中的部分工作,比如可以完成仓库搬运工工作的机器人;而“彻底清除”则从根本上重构整个行业,比如人工智能驱动的借贷公司,无人商店、餐厅等,因为这些公司就不会雇佣人类员工。
李开复在卡内基梅隆大学的老师汉斯莫拉维克提出了莫拉维克悖论:与一般观点相反,让人工智能模仿成年人高知识水平或运算能力比较容易,但要让机器人具备婴儿的感知和感官运动能力,则困难得多。李开复老师戏称人工智能是“演算的巨人,行动的矮子”。
人工智能自动化时代将首先对白领造成冲击。相对于人工智能算法对白领导弹空袭式的冲击,很多任务对机器人而言难度就大多了,机器人对体力劳动的打击则接近于地面的堑壕战。
.END.
chatgpt是什么意思
ChatGPT是一种由OpenAI开发的通用聊天机器人模型。
它被训练来对对话进行建模,能够通过学习和理解人类语言来进行对话,并能够生成适当的响应。ChatGPT使用了一种叫做Transformer的神经网络架构,这是一种用于处理序列数据的模型,能够在输入序列中捕捉长期依赖性。
它还使用了大量的语料库来训练模型,这些语料库包含了真实世界中的对话,以便模型能够更好地理解人类语言。还能够实时回答用户提问,包括聊天、纠正语法错误,甚至是写代码、写剧本等,由于可玩性很高,迅速在全球范围内风靡起来。
ChatGPT带来的影响
ChatGPT大红大紫之际,就有诸多学者和研究人员发出警告ChatGPT很可能杀死大学论文。无独有偶,在很多互联网大厂,ChatGPT也遭到了封杀。
ChatGPT背后的技术很快就会对整个科技行业产生更深远的影响,微软公司的人工智能平台主管埃里克·博伊德表示:ChatGPT的人工智能模型将改变人们与电脑互动的方式,与电脑对话,就像与人对话一样自然,这将彻底改变人们使用科技的日常体验。
结语:以上就是首席CTO笔记为大家整理的关于人工智能GPTs什么意思的相关内容解答汇总了,希望对您有所帮助!如果解决了您的问题欢迎分享给更多关注此问题的朋友喔~