ChatGPT是什么
ChatGPT是由美国公司AI target=_blank class=infotextkey>OpenAI基于GPT—3.5架构开发的大型语言模型,能够生成各种不同的文本类型,可以针对对话场景进行特别优化,根据上下文自动生成跟人类一样的对话文本。OpenAI在公司官网对ChatGPT产生方法进行介绍时说,该模型是使用人类反馈强化学习训练而来,方法与Instruct GPT(OpenAI开发的一种“指令生成预训练”语言模型)一致,但在数据收集设置上略有不同。
ChatGPT工作的原理及技术架构包括四方面内容:
第一,生成基于GPT的模型(AI在海量数据下学习基于前后文生成后续文本能力),由于GPT模型会产生多个不同的输出结果,例如:告诉GPT“世界上最大的平原是____”,可以给出“绿色的”“是无边无尽的”“亚马孙平原”等多个合理答案。
第二,引导方向,并监督微调初始模型,通过前述问题,不难看出“亚马孙平原”是最符合人类期望的答案,因此,开发者通过人工给出一些问题答案,进而训练AI学习,从而形成一个初始的ChatGPT模型。
第三,提升能力的奖励模型。研究人员会让GPT对特定问题给出多个答案,由人类进行好坏排序,基于比较数据从而生成符合人类标准的回答模型。
第四,AI指导AI,强化学习。由于以上三步形成较为成熟AI,因此使用AI指导AI进行强化学习,不断训练迭代,形成完整ChatGPT模型。
ChatGPT具有广泛的知识储备和强大的语言理解能力,让翻译、生成文案、分析文本等工作变得简单,极大提升了工作效率。它还具有较强的自我学习及推理能力,也让应用场景变得多样,不仅能够从事文字工作,还能够从事AI建模、语音交流、图像生成等复杂工作。
听到这里是不是很心动
chatgpt能帮我们做这么多事
但需要注意了
ChatGPT应用可能产生安全风险。
使用ChatGPT时可能
导致的安全风险
使用ChatGPT面临着较为严重的版权风险。从ChatGPT生成框架来看,ChatGPT运用大量不同的数据集训练形成大型语言模型,它的数据集可能来自受著作权保护的材料,若没有经过授权,则可能存在侵犯他人作品复制权的问题。
从ChatGPT生成内容来看,ChatGPT具有强大的语言重组和整理能力,当用户输入特定命令时,若ChatGPT生成的内容主旨与他人在先前作品独创性表达存在部分或完全一致时,基于ChatGPT通过计算机传播,且用户可以在自己选定时间及地点获取内容,符合信息网络传播权构成要件,因此存在作品信息网络传播权侵权风险。
此外,ChatGPT作为典型的语言模型,它的模型训练需要海量的文本数据集,若开发公司为训练ChatGPT引入特定作者的作品进行训练,在未经相关著作权人许可情况下,当用户输入特定命令时,ChatGPT生成的内容若具有一定独创性,且存在与在先作品的相似表达,即便其可能会构成演绎作品,但其生成内容也为侵权作品;若开发公司训练ChatGPT时,从未引入特定作者的作品,只是由于用户的特定问题使算法“预测”生成内容时刚好与在先作品相同,则不构成侵权。
因此,如何规制ChatGPT带来的侵权风险,大家还需要持续性的关注和思考。
来源:融媒体中心 深圳文化产权交易所