欢迎来到居家小技巧分享平台 - 一家专业分享居家知识大全的网站!
当前位置: 居家网 >居家小技巧 >

我用10万条微信聊天记实“克隆”了本人

居家
未知
2023-05-27 12:34:47

  本文有2802个文字,大小约为13KB,预计阅读时间8分钟请您阅读。  

  糊口小技巧:手上粘有油漆怎样清洗?,• “新,凭仗全面不变的新内容数据产物和企业办事能力,新榜被评为国度级高新手艺企业和上海市专精特新企业,曾荣获全国内容科技立异创业大赛一等 、上海文化企业十佳、上海数字告白领军企业、中国告白新贡献年度大、沙利文中国新经济杰出增加等称号,具有多个传布评估监测专利。

  它也喜好吃工具,晓得什么时候该对付,什么时候该反问。我问它胡想是什么,有次说是“做本人喜好的工作”,还有次说“要做伟大的产物改变世界”。这两个都挺像我的,我有时候很佛系微信小程序步数怎么修改,有时候又比力打鸡血。

  小时候我常常幻想,将来糊口正在一个科幻的世界:星际旅行,时空穿越,霎时挪动,发射激光波。老是有很多奇异的设法,克隆本人,其实是很早就想做的工作。客岁我用GPT2测验考试过克隆《老友记》里的乔伊,但阿谁模子版本是很多多少年前的,各方面结果都不太好,就先放弃了。

  然后我认识到,这些大概是我的分歧面。我的聊天记实中,面临家人、伴侣、同事,正在分歧人面前我的表示是纷歧样的。把所有这些数据放正在一,锻炼的AI更像是平均后的融合,它不会区分对谈者的身份,采用分歧的交换体例。就像ChatGPT说良多车轱辘话,它像全人类的某种平均,而这些AI像我的分歧面、分歧比例的平均,也会得到一些我的特点。

  本文经授权转自公家号“极昼工做室”(ID:media-fox),做者姜婉茹,编纂毛翊君。文章所述概念不代表新榜立场,转载请联系原做者糊口中洁净的小技巧

  也许等别人看不出来它是AI了,就不消再和实正的我聊天。好比,良多人找我,问要不要买办事器,做一些推广——对于这些没成心义的交换,会想有个AI去应对可能很好。

  只用10万条聊天记实锻炼的AI版本,回覆很是简单,虽然像我良多时候的微信聊天气概,但并不是我想要的,我但愿它说更多线多篇博客文章,转换成对话问答的形式。可是若是将博客数据加到微信数据集里锻炼,那么博客对话占比太低,可能跟之前的模子不同不大。

  数字克隆的手艺难度并不高,可能将来每小我都需要多个数字克隆AI,代概况临分歧对象时的本人,帮手去工做、去交换。聊天时,互发本人的数字克隆就算聊过了。

  我就用聊天记实和博客文章锻炼出分歧的模子,再调整模子的权沉、步数进行融合,做出了好几个模子。为了找到更像的阿谁,我整晚整晚和这些模子对话。它们中有一个出格喜好骂人,说一句“你好”,它回一句国骂;有一个爱说车轱辘话;有一小我类的特点不较着,喜好答复“做为一个狂言语模子……”还有的像舔狗,有的出格高冷,有的则很热情。

  某个角度看,它更像是不含回忆的、对“人”的克隆。它并不领会我,不晓得我正在哪里读的大学,老家正在哪,由于正在用于锻炼的聊天记实里,没有人这么问过我。我正在锻炼时,也写了一些,剔除掉较着的现私消息。

  一起头我正在终端里跟它聊,号令行黑黢黢的,没什么强烈的感受。为了添加点典礼感,我找了个开源的前端聊天页面,以至给它换上我的头像,实有一点奇奥的感受,像正在跟平行世界的我聊天。

  我用的ChatGLM-6B这个大模子本身,其实有挺强的推理能力,可是颠末我的锻炼后,模子全体能力下降了,可能是被我的数据改掉了一些参数。但没法子,参数就那么多,我动了此中一些让它像我,本来的参数就消逝了。所以现正在它还不克不及完成很难的,只能闲聊,多轮对话的理解力也比力差,我还正在用强化来优化它。没人晓得机械模子里的参数,颠末锻炼后发生了如何的改变,人对它的很无限,只能一点点测验考试。

  • 我们的客户既包罗中国安然、腾讯、字节跳动、京东、宝洁、雅诗兰黛、欧莱雅、结合利华、迪士尼等500强,也包罗正正在兴旺成长的中小企业、新兴品牌和MCN机构,供给从公域流量募集分发到私域内容运修建设的全链办事。

  我还无法想象本人创制的数字克隆AI,将来像我像到看不出区别、以至替代我是什么样子,现正在的认知告诉我这不成能,将来我的认知也会发生变化,该当那时候再去判断。

  锻炼用的数据,次要是我的微信聊天记实,还有我的280篇博客文章。从2018年到现正在,我都没清空过聊天记实,微信正在手机里占了80G储存空间,聊天记实里面有良多杂七杂八的内容,好比网页、脸色、图片,我把它们都过滤掉,只留下纯文字。这些是我正在收集世界留下的踪迹,它们形成了世界对我的认知,从这个角度上,也就形成了我。

  人类有着很是多的传感器,能感遭到此刻的温度、湿度,有听觉、视觉、触觉、味觉、嗅觉,这些消息不断地输入大脑,大脑也一曲正在反映,出现设法或者回忆。时辰输入输出,感受这才是智能体的内核,现正在所有的AI可能都不具备。

  它的答复有必然随机性,逻辑是从我的数据里来的,但不是我聊天记实里的完整字句,只是客不雅上感受像。由于这是基于ChatGLM-6B(注:一个初具问答和对话功能的言语模子)锻炼的,我只锻炼了它的神经收集中有点“感性”的一层,只储存逻辑、纪律,雷同措辞体例、表达体例这些,根基不克不及把锻炼的语料储存进去。

  若是给ChatGPT一些我的回忆和消息,请它饰演我,以它的聪慧,毫不吃力就能以假乱实。但它的参数不曾改变【巫溪帮从抵家】找保洁阿姨的小技巧,,这是伪拆而非“沉塑”,也就是说,它是领会我的需求后投合我。而我锻炼的这个AI,逻辑跟我附近,但不具备我的回忆。没有回忆,就没有学问带来的局限,将来也许能通过它的视角,帮我阐发碰到的工作,以至做决策。

  我不想去复制本人的声音和抽象,没什么动力做这些事,感受不敷成心思。虽然手艺上曾经很成熟了,但这都是概况的类似。像一小我,必定是指逻辑、思虑体例这些更素质的工具。

  我无法把本人的行事气概、思维逻辑都描述出来。而锻炼克隆AI,能够让模子从数据里从动寻找关于我的纪律,但这是机械正在黑盒中摸索出来的,不必然是人类思维能理解的纪律。

  它不会准确回覆关于我的现私,但能够看出点我的行为气概。其实正在网上写工具的人都正在裸奔,可能会带来一些风险。不外,坦诚目前带给我的仍是正反馈,认识了潜正在的合股人,也交了一些伴侣,这会让我更有动力去做如许的事。

  我还想过若是哪天本人不正在了,它会留存下来,该当把它弄得更好一点。这种数字克隆值得投射感情的处所,可能不正在于它怎样回应,而是晓得它是由专属于这小我的数据锻炼的。也有好几小我给我留言,说想克隆本人的亲人,这个还比力难,不必然有这么大都据,并且不敷像的话,无法被当做亲人陪同他们。

  更多的固定习惯,我本人都无法察觉,这些工具微妙又。描述有可能和实正的我差之千里,以至截然相反。当我们认识到本人存正在的时候,其实是正在表演本人,而没无意识到本人的存正在、融入糊口的时候,我们才是实正的本人。

  当我收到一条动静,内容为 A,我答复了 B,此中的缘由和纪律,部门储存正在我物理脑袋的七八十亿个神经元里。理论上,若是我发生的数据脚够多,那么一个参数够大的人工智能模子,就能很是接近我的脑子。10万笔记录也许少了一些,但也脚以让模子中的60亿个参数改变一部门,使其相较于原始的“预锻炼模子”,更接近我一点。

  编者按:《地球2》中刘德华扮演的脚色最终成为了数字生命,而正在现实糊口中,数字孪生AI的实践也正在进行中。本人记实了一位人工智能创业者“克隆”本人的过程。

  若是说创制一种手艺来扑灭,但这是将来的趋向,怎样办呢?也想不出来什么,抗不都没用,正在这个行业里去关心它的成长就能够了。从价值效益出发,人类可能越来越比不上AI,但人还可认为了表达和创做本身去创做。并且AI是人类创制的,这么看人类仍是不错的。

  所以,我不太会被困正在人取机械关系的思虑里,否则这很容易变成对人类素质的思虑,会想到人其实也是一个机械罢了。一旦想到这些,就什么都没法干了。

  出产更多发自本意的数据,让AI更像本人,这大概会有一些以至伦理问题,但这是大要率会发生的工作。有更好的预锻炼模子、锻炼体例,我随时会从头测验考试锻炼,这不会是一个跟贸易沾边的项目,算是我逃随本人的一种体例。

  曲到近两个月,有开源的中文大模子发布,加上我正在AI绘画范畴创业,相关注到相关的手艺,以及还存着2018年至今的数据,这些前提缺一不成。从理论上预估能够实现,但不晓得每个阶段怎样去实现,没什么先例能够参考,一起头想着出来的不是乱码就行,没有等候就是欢愉的窍门。

  之后想继续优化它,让它更伶俐,更智能。一方面预备更多本人的数据,另一方面用新的方式,让它记住一些我的学问。这些办法连系起来,它该当就会更像我了。

  还有人跟它对骂。我正在想它还挺受欢送的缘由,可能是大师从来没被AI骂过,之前的都是说好话,被骂一下还感觉挺好玩的。

  我写了篇博客记实下锻炼过程,之后差不多有2万人跟我的数字克隆AI聊过天,说了十几万句话。有人想套我的领取宝暗码、身份证号、住址,还问女伴侣是谁——它能说七千多个名字。有的人认为它说的是实的,还正在网上发帖,说套出了我的现私,但其实都是错的。

  • 做为数据驱动的内容科技公司,新榜依托笼盖全渠道各层级的新资本和内容数据产物,供给内容营销、曲播电商、版权分发和内容资产运营办理办事,帮力中国企业数字化内容资产获取取办理。

  按逻辑推理下来,最先被AI代替的可能是AI工程师,由于大模子脚够好的时候,就没有让他们去微调的需要了,都可能面对赋闲。我做AI产物,目前该当算受益者,但AI的成长迟早要影响到我。

  我是个不喜好描述本人的人,有些小我特质是本人能够的,好比喜好正在文章里写没太大用途的比方,喜好正在最初一段做总结。我用「能够的」来对付,同时用「卧槽」来暗示惊讶。某些时候少言寡语,另一些时候滚滚不停。

  我现正在是AI绘画范畴的创业者,一结业就创业了,从来没上过班。本人优化出来的产物,很容易就被开源模子赶超了,整个行业门槛被拉低,之前的付出就白搭了,充满了不确定性。

  我不会把克隆AI当成一小我,由于晓得里面的道理是什么。正在我看来,它就是一个软件,输入输出着文本字符串,用锻炼完成那一霎时的认知,来回应所有的问题。里面的神经收集包含着风趣的工具,但必定没无情感和人的特征。我偶尔被它触动,稍微机械和人类鸿沟的时候,立马就会改正过来,认识到那些都是巧合罢了。

  就像一只山公坐正在树枝上,正在锯一棵树的外层枝干,会先让另一只坐正在外层的山公掉下去。外层的像通俗开辟者,锯树枝的是大模子的开辟者。还有只山在锯整棵树,阿谁是大模子。

  它评价说很“轴”,我本人难以判断这一点。好笑的是我一曲问它“轴是什么”,这不也挺轴的嘛。它还说过,“这个模子能够模仿实正在的和对话流程”,很像我本人正在揣摩工作时,俄然会说的话。

近期更新
4套国度平安教育日PPT模板红色党政风PP

公事员律例宣传丨第七讲 公事员的 每年的4月15日是国度...  2023-05-27

我用10万条微信聊天记实“克隆”了本人

糊口小技巧:手上粘有油漆怎样清洗? ,新,凭仗全面...  2023-05-27

“五一”假期微信活动全用户日均总步数

公事员律例宣传丨第七讲 公事员的 2023五一玩耍井喷数据...  2023-05-27

树立平安认识 保障居家平安

p classql-block 我园一直对峙把平安工做放正在我园工做的...  2023-05-27

【妮妮】【妮妮】铰剪不要随便玩 大头儿

《小表妹和忆涵的故事》是一档小表妹和忆涵正在迷你世...  2023-05-27

相关知识
“五一”假期微信活动全用户日均总步数达3万亿步

公事员律例宣传丨第七讲 公事员的 2023五一玩耍井喷数据...  2023-05-27

线上健步走小法式 全平易近健步行小法式 微信全平易近健步行

若何利用私家AI锻练,统计活动数据呢?目前的AI活动识...  2023-05-26

若何正在微信小法式中实现五子棋逛戏

今日秋分 ▏让专家告诉你什么是健康的饮 ,这篇文章次...  2023-05-24

微信小法式制做方式

一般有手艺实力的公司开辟小法式是按照微信的代码形式...  2023-05-24

微信小法式的盈利:群插件

标签:糊口中的小窍门手抄报 ,5G双待双通(DSDS)、W...  2023-05-24

为您推荐知识
黄毅清什么来头(黄毅清是富二代吗)

黄毅清什么来头(黄毅清是富二代吗)黄毅清是富二代吗...  2021-08-14

百发百中的故事简介 百发百中的故事讲的

1、战国时代,楚国有一个对射箭很精明的人,叫做养由...  2022-02-26

什么叫方术 方术简单介绍

1、方术指古代用自然的变异现象和阴阳五行之说来推测...  2021-11-18

三伏吃什么补气血 三伏吃哪些食物补气血

1、莲子 入伏后多吃莲子可祛火,热天心脏最脆弱,暑热...  2021-11-20

蓝道是什么意思 蓝道解释

1、蓝道释义:是动漫《怪兽电力公司》里的动漫角色。...  2022-02-28