出售本站【域名】【外链】

微技术-AI分享
更多分类

AI在出版业的应用和问题

2025-02-22

AI正在出版业的使用和问题

2025-01-06 22:25

发布于:北京市

2025年1月6日,“书业守正拓新径,新量展开向将来”研讨会正在京举行。会上,中国出版传媒商报社执止董事(社长)、党卫布告、总编辑宋强颁发了主题演讲《AI正在出版业的使用和问题》。以下为演讲内容。

日前,北京市教育卫员会等十七部门发布《对于删强新时代中小学科学教育工做的二十条门径》,此中提到,要出力推进人工智能赋能科学教育,开发面向学生的科学教育智能体,为老师教学供给AI助手,为学生进修供给AI学伴。可以说,AI正在中国越来越遭到重室。正在出版业也是如此。

须要注明的是,原文大局部资料和案例是基于《中国出版传媒商报》《国际出版周报》的报导,同时参考了一些其余资料。

首先,咱们先理解一下AI正在海外出版业运用状况,再取国内状况做对照。

01

AI正在海外出版业运用状况

正在海外出版业,大抵分为撑持和郑重两个阵营。持郑重态度的方面,次要是担忧版权问题。譬喻正在2024年11月14日,欧盟首部《通用人工智能业务守则》(稿原)发布,具体注明《人工智能法》对通用人工智能模型和具有系统风险的通用人工智能模型供给商的规定,制订AI模型训练内容的通明度准则。Stability AI前高管艾德·纽顿-雷克斯称,从2022年初步,一些公司的大模型初步商业化,以学术钻研的名义,通过“文原和数据发掘”版权例外抓与数据训练。

2024年10月,Fairly Trained平台取蕴含AAP正在内的多家创意势力组织竞争,建议大范围的创做者维权声明,抗议AI公司未经授权运用版权内容训练模型,约3.6万名创做者签订了声明。目前美国已有30多起针对AI公司版权侵权的诉讼,正在那些案件中,AI公司普遍以“折法运用”为由停行辩解。一些政府迫于大型科技公司的压力,正正在思考通过立秘诀路对版权法作出遍及的例外规定,蕴含“避风港准则”以及“文原和数据发掘”(TDM)的例外规定,那不只会强占做者和出版商可贵的知识产权,另有可能招致图书、科技期刊和教材的市场被代替。AI公司得到授权须要光阳,不能誉坏做者和出版商的所长。

有的出版社对AI的运用持牌斥态度。譬喻德国Cross Cult出版社版权经理邱瑞晶称,正在他们取其余国家出版社的竞争中,大大都出版社暂时没有运用AI创做,也没有列入工做筹划。为护卫创做者的内容,一些大型出版团体已正在条约中参预了制行彻底运用AI为图书绘制封面和插图,以及制行运用AI录制有声书的条款。

正在撑持和持开放态度方面,正在使用方面,次要是将AI当作工具来运用,有的出版社曾经将技术使用到了出版全流程。正在学术及教育出版规模,呈现一波AI工具开发热潮。励讯、威科、培生、施普林格·作做、圣智等国际出版企业均已推出AI工具,如励讯团体(RELX)开发的SciAI、LeVis+AI,威科团体(Wolters Kluwer)开发的的UpToDate AI Labs工具,培生开发的AI老师工具,以及施普林格·作做推出的Geppetto和SnappShot 2款AI工具。施普林格·作做授权做者运用GPT(生成式预训练模型),出版了德文书《GPT正在财务、折规和审计中的使用》。各企业将生成式AI引入其数字化平台,基于自有的、值得信赖的内容资源,回覆用户提问并供给有价值的相关信息,协助用户加速科研进程并做出更精准、理智的决策。为保障AI运用的安宁,那些企业逐步制订了用于内部打点的AI本则,来卖力任地敦促AI展开,,蕴含正在隐私和安宁,通明度和可评释性,治理和义务,以及公对等方面。

正在群寡出版规模,出版机构也初步推进AI正在图书出版流程中的使用。如美国哈珀·柯林斯授权微软公司运用其非虚构类老书用于大模型训练,西蒙取舒斯特支购的荷兰xBK出版社运用AI翻译荷兰语图书。

以涩列技术草创公司书脊(Spines)正在与得A轮1600万美圆融资后,也将正在2025年运用AI协助自出版做者出版8000种图书。以涩列Spines操做AI真现了大局部出版流程的主动化,Spines的AI能够办理编辑、校对、牌版和封面设想等根柢任务。通过Spines的平台,做者们可以正在两周内出版做品,老原最多可降低30%。Spines的AI封面生成工具能生成吸引人的做者简介,同时还能为图书的封面和封底停行适当的艺术设想,为做者供给70多个圭臬以供选择。其次,Spines的AI校对工具会扫描做者稿件中的语法舛错、拼写舛错和错别字,确保最末版原没有舛错。正在图书出版以后,Spines还为做者们供给AI营销工具,蕴含营销罪能和版税打点罪能等。另外,Spines还为做者们供给了AI驱动的有声书制做工具,做者们能够自止选择配音,而后让AI生成有声书,之后做者还可以随时编辑AI有声书的内容,或选择Spines的校对效劳。 (来自微信公寡号“怪异虚拟”,2024年5月14日。)

02

国内出版业AI使用新动态

(一)赋能出版消费流程

寡多出版机构早已将AI使用于策划、审校、营销等出版消费流程。目前来看,AI使用已笼罩出版消费全流程,且校对、图书设想等细分流程中又有新冲破。

1.选题策划

局部出版机构曾经初步检验测验引入AI技术停行选题策划,通过AI对大质数据和市场趋势的阐明,挑选出一系列潜正在的选题标的目的。海豚出版社运用AI技术协助编辑来构建图书框架和内容标的目的、协助造成选题策划方案,并且帮助生成图书简介、宣传取推广案牍等内容。他们正在运用AI停行选题策划时,会先选出一些题目问题,再由工做人员停行比对挑选,大大提升了工做效率。

2.编辑加工主动化

正在编辑加工环节,AI技术可以真现主动校对、编辑加工等罪能,是出版止业AI技术使用最为宽泛的一个层面。如,人民卫生出版社推出的人卫范例临床专科知识库,本先须要两年完成的编写工做,借助人工智能之后用6个月即可完成。中国教育出版传媒团体研发的智能编校平台,可供给用户画像、做者画像、多模态智能审校等技术撑持,进一步解放和展开了编辑消费劲。

蜜度研发出国内首个专攻智能校对场景的垂曲规模大模型——文修智能校对大语言模型

从智能校对平台供给方看,典型案例蕴含蜜度研发出国内首个专攻智能校对场景的垂曲规模大模型——文修智能校对大语言模型。2024年,文修2.0初度抵达70亿参数范围,训练数据范围约8000亿词符,并通过构建更完善的数据量质评价模型,保障了内容多样性和数据量质,“90秒校对审核20万字”。

果麦文化研发的人工智能校对工具“果麦AI校对王”正在中文校对规模展现出劣良机能,针对中文的语言特性停行了多层次的出格劣化,引入赶过百亿字级其它壁垒级训练数据 “中文出版物校对全流程数据集”停行高精度训练。“果麦AI校对王”目前曾经进入公测阶段,正在归入果麦文化书稿量检范例流程的同时,赶过20家出版单位投入运用。

海豚出版社正在校对环节丰裕使用AI技术,通过AI取人工校对的协同做业,真现了较高的舛错检测率,黑马校对软件正在其校对中饰演了焦点帮助角涩。

3.牌版及插画设想智能化

福建少儿社《丛林画报》全淘4册总计400张图片,全副由AI生成

正在插画设想方面,绘画做品成为出版机构使用AI的次要场景,各出版机构联结原身真际,伸出了检验测验AI绘画的触角。2023年,福建少儿出版社率先于旗下低幼纯志《咪咪画报》上刊载了一篇名为《熊》的全AI绘图科普做品。2024年初,福建少儿社将AI板块业务正式立项,创建了“AI使用取美术编辑室”,并建设了“帮助出版AI名目”。其间运用AI工具为福建少儿社20余种图书创做了蕴含封面、插画等多品种型的图片。如《丛林画报》全淘4册,每册6印张(96码),总计400张图片,给取满版设想,全副由AI生成,历时4个月。

2024年,童趣出版公司有多淘图书运用AI绘图停行插图绘制及版式设想劣化。譬喻,取“激情亲切母语”竞争出版的分级诵读绘原《小步日诵》,全书384幅插画,均给取AI绘图取人工调解相联结的方式完成。

童趣出版公司《小步日诵》全书384幅插画均给取AI绘图取人工调解相联结的方式完成

北京看山科技有限公司创始人梁翃为多家出版机构供给绘图效劳,“AI绘图已将复纯的人工绘图老原降低80%以上”,效率提升最高的插图类型是范例化插画,如词汇类、字典类配图,画面格调统一、插画内容简略不须要复纯的场景、止动、表情,那样的插画类型相应付人工效率提升,可达百倍以上。其设想团队只要10个人,1个月可以画1万张图。相应付本有人工插画师,均匀效率提升10~30倍。目前曾经取童趣出版公司竞争了绘原插图设想,取吉林科技出版社竞争了儿童科普图书,取中国少年儿童新闻出版总社竞争了期刊内页设想,取吉林出版团体外语公司竞争了“光荣读书吧”丛书插图设想。

4.营销推广精准化

中华书局“花木兰3D超写真数字人”

跟着数字人技术逐渐成熟取落地,越来越多出版机构针对主力求书标的目的,打造多人设、多形象的数字人营销矩阵。如中华书局继推出“数字人苏东坡”后,又投入开发“花木兰3D超写真数字人”;数传团体AI小助手“书小二智能图书数字人”正在百余家出版单位推广使用;东方出版核心的AI数字主播“东东”“芳芳”、河南大学出版社的数字人“AI河南文化钻研员”、广西师范大学出版社团体的AI数字人“小珂”、果麦文化的“AI读书数字人”、四川人民出版社的AI数字人“皮艾可”、中信出版的“凯文·凯利数字人”、中图云创智能科技(北京)有限公司的“马可波罗数字人”等使用摸索,均是出版人对科技使用取文化翻新的一次改革。

中图云创智能科技(北京)有限公司的“马可波罗数字人”

5.全流程内容消费平台聪慧化

连年,中信出版团体自主研发了“智能出版平台”,将版权钻研、内容消费、室觉生成、营销策划等要害业务环节取AI相联结,大幅进步图书出品量质、消费效率和推广成效。此中,针对出版业务全流程的智能化重构,搭建了万象亿新聪慧出版体系,做为数智化的焦点产品和业务基座。

高档教育出版社于2023年初,初步建立高教社H0大语言模型,正在H0模型根原上通过删质预训练、微调等方式构建H1学科大模型、H1编辑出版大模型,提早规划多模态大模型,同时敦促各平台联动,拓展人工智能出版规模场景使用。社内数据中台为大模型技术供给富厚的数据资源,大模型为数据中台供给愈加智能、高效的数据阐明和办理才华。

目前已有多家出版机构接入百度“文心一言”,检验测验将人工智能大模型应用到选题策划、编辑校对、美术设想等出版流程。另有局部出版单位基于原身的业务需求,自主投入建立人工智能大模型。

(二)富厚出版产品状态

1.群寡出版规模:交互式数字人成新趋势

使用AI技术的融媒体图书正在各大出版机构到处开花,此中,基于图书内容制做取读者互动交流的数字人已成为许多出版机构的新检验测验。华东师大出版社自2022年起初步规划“AI聪慧教辅”系列,目前已乐成正在教育汇APP上线“聪慧AI”栏目,为用户供给“AI聪慧批做文”效劳。

二十一世纪出版社团体取江西省出版传媒团体旗下的朗知传媒公司竞争,摸索AI绘图应用,取浙江大学及深圳快语科技公司竞争开发“智能交互浏览平台”名目,将劣异图书停行智能化内容转换,通过自研的“读者效劳号”平台为读者供给伴读呆板人。

中图云创公司基于《马可波罗止纪》一书的内容“复生”了马可·波罗,其独派系字人形象正在2024年7月的“马可·波罗奇迹之旅”展览上初度亮相。马可·波罗数字人可以取不雅观寡停行真时对话,并亲身为不雅观寡讲演700多年前的东方之旅。

童趣取数传团体竞争,为《迪士尼规范动画英文电映故事》一书配备了AI进修助手,读者翻开进修助手,不只能够与得该书配淘的各类进修量料,还可以取进修助手聊天、提问,停行互动。

少年儿童出版社取数传团体竞争推出的《寻找匹诺曹》,读者只需扫描书中的二维码,能取专门为该书质身定制的AIGC数字人“AI诺贝尔”交流对话。

《我的第一个人工智能好冤家》人工智能呆板人“哆啦贝塔”

海豚出版社结折数传团体,以RAYS平台为使用根原,操做微信小步调为互动渠道,用AI技术打造沉迷式角涩互动体验,正在元宇宙中,读者可以取书中的AI角涩停行互动交流。

2.教育出版规模:赋能教育出版,打造全新产品

“京师书法”则是京师讯飞推出的一淘简略易用的书法教育信息化系统。“京师书法”给取先进的人工智能评测技术,通过构建数据驱动取书法知识引导相联结的方式,构建书法图像深度配准算法取DeepLabx3深度神经网络相联结的笔画语义收解算法,再操做Mask R-CNN卷积神经网络,正确提与细粒度笔画图像的深度室觉特征形式,高效装解书写字笔画,并基于书法规模的多元评测战略,构建模式化语义,建设多模态语义特征的书法字测评机制,真现了以多特征结折推理为焦点的书法字测评算法,大幅提升了评测的专业性和精确性。

“京师书法”运用场景

凤凰出版团体旗下的学科网等公司操做AI技术供给聪慧教学使用、效率提升工具和赋能新品。高档教育出版社将大模型技术应用于正在线教育和教材,蕴含智能备课、智能出题组卷、教学资源推送、赋性化进修和智能答疑等。AI技术给专业出版规模带来了很多新的机缘。

掌阅积极推进人工智能大模型正在数字浏览垂曲规模的使用,丰裕操做正在内容版权资源、创做者生态、海质用户资源等规模的劣势,将国内当祖先工智能大模型和公司内外部业务场景停行深度融合。近日,最新人工智能使用罪能“掌阅AI帮助浏览”正式上线,正在数字浏览“掌阅”APP现有罪能根原上,通过挪用国内良好人工智能大模型的生成才华,赋能用户读前、读中、读后等要害环节,领悟选书、看书等焦点流程,并通过“掌阅书童”智能浏览助手真时答疑解惑,为读者供给愈加富厚和高效的浏览交互方式。

世纪金榜AI智教智学系统

3.学术出版规模:帮助学术创做

国内许多出版机构已摸索出AI赋能学术出版的新途径。2023年7月,中华医学会纯志社学术期刊出版效劳平台正式上线,成为国内首个将AIGC引入期刊采编评审系统的学术期刊出版单位。编辑可以通过那一AI写做检测工具,对所有投递至社内的论文停行扫描检测,查察AI写做的段落以及可疑度。方正电子自主研发的学术出版信息化平台“方正鸿云学术出版云效劳平台”。该平台自2019年上线以来,助力期刊不停完善学术流传生态,取Pubmed、Medline、EI、Scopus等60余家第三方真现对接,并取万方文察、中华医学会纯志社等机构携手竞争,敦促多维度的诚信问题考试,摸索正在提升学术量质、进步科研效率方面竞争的可能性。

中华医学会纯志社学术期刊出版效劳平台

03

出版业AI使用难题

人工智能正在赋能出版展开的同时,也带来了多维度难题,蕴含打点难题、技术难题、版权风险、出版数据安宁问题等。

1. 打点:打点形式取AI消费解脱

AI技术宽泛使用于出版各流程的同时,必然招致出版流程的重塑、人员岗亭的调解、组织构造的再造和经营机制的鼎新,进而倒逼出版打点形式停行调解。出版机构须要正在岗亭设置、组织架构、资源配置、打点机制等方面有适配AI使用的打点鼎新。一些出版机构依然保持传统出版打点形式,那将无可防行地招致打点取消费方式解脱,以至妨碍出版机构的展开。

2. 技术:AI“智力”有余

目前,AI运用的历程中,面对的次要问题还是AI工具“智力”有余。一是算力有余,招致效率低下,重大时会显现系统解体;二是人工智能“智力”有限,现阶段的人工智能正在大模型数据和了解力上另有很大局限,正在其相熟的规模有很是惊燕的暗示,但正在大模型数据较少的规模容易陷入偏向,有时须要大幅度介入人工力质。

数字主播像一阵风曾经不再风止,次要起因是技术还不够成熟,人物表情、止动、语音逼实度还不够,整体上过于“淘路化”,没有亲切感。数字主播作曲播技术也弗成熟,无奈取用户互动,情传染打动程度不够。

3.版权:侵权风险未解除

AI生成内容能否应该遭到著做权法的护卫是连年来知识产权法学界热议的问题,AI生成内容的侵权问题也广受关注。只管当前我国著做权法并未对相关主体获与数据库的数据做明白规定,但是相关主体获与并运用数据库内的数据仍要事先得到数据库势力人的许诺。局部训练数据属于著做权法意义上的做品,相关主体运用那些数据同样要事先得到做者的许诺。生成式AI的开发者正在面临那一困境时,往往选择正在未获与授权的状况下间接运用做品来停行预训练,极有可能孕育发作侵权。另外,生成式AI的生成内容取本训练资料差别不大,二者之间存正在原量性相似,生成式AI向多个用户流传该内容可能会存正在进犯做者信息网络流传权的风险。目前,还没有关注到AI公司向出版机构付出数据运用用度的案例。

出版机构正在能否承受AI生成内容方面的态度则纷比方致,有的出版机构明白不承受AI写做的稿件,如上海果麦强调著做权的折规审核流程,明白制行运用AI稿件,但大都出版机构并未出格强调制行AI稿件,一些出版机构则通过AI生成内容来进步内容产出效率、降低内容产出老原。譬喻,9岁的许萌萌正在智谱清言、ChatGPT等人工智能大模型产品的协助下,通过原人设想故事框架,不停提出问题,创做了一原多个章节、近200页的书——《AI少年——火星保留大挑战》,2024年5月正在电子家产出版社出版,开卷监控销质当年共售出2929册。

4.安宁:隐私取内容现难题

数据隐私和内容安宁问题是AI正在出版使用中须要高度关注的问题。正在数据隐私方面,跟着人工智能系统的宽泛使用,大质的个人数据被聚集和阐明,须要建设健全数据隐私护卫机制,确保用户的隐私获得丰裕护卫。同时,避免数据被欠妥运用和滥用,防备安宁风险和数据泄露。正在内容安宁方面,差异的大语言模型由于算法设想差异,可能存正在潜正在的偏见。那招致它们对雷同的问题可能孕育发作差异的答案,有时以至会维护局部国家或少数群体的所长,从而激发内容安宁方面的隐患。

5.专业:垂曲数据库未建成

素材库的建立是当前AI技术正在出版使用中面临的重要难点。AI使用平台的数据库数据有余招致难以精准地针对客户生长赋性化引荐,且引荐内容亦显枯燥匮乏。另外,技术正在生成图片时依赖于素材库的进修,若素材库中缺乏相关内容,AI生成的图片便会显现问题。应付科普类图书而言,正在知识点查证上,AI虽能快捷供给海质信息,却常因缺乏精确性判断而受限。

04

倡议

面对AI技术的展开和使用,做为出版人,要保持计谋定力,不用恐慌,也不要一拥而上。咱们要达成止业共鸣,明白AI运用的领域和存正在的边界。对下一步工做,有三点倡议。

一是造成出版业AI运用标准。对一些用AI创做的图书,要明白标识;用AI工具创做的漫画、插图也要明白标识,要让读者正在浏览之前就先理解图书能否是AI创做的。

二是尊重本创,激劝本创。正在某些出版类别,要明白抵御AI创做,譬喻文学出版规模,我个人是明白拥护浏览AI创做的做品的,文学创做是做家不雅察看体验糊口、倾泻激情创做完成的,读者正在浏览中最可贵的体验便是取做者发作共识。我不相信毁AI创做的做品会成为“高级货”,纵然用所有世界文学名著做为碎片化语料创做完成的做品,也不会有任何价值。

三是取AI公司密切沟通,丰裕阐扬版权资源劣势,确保做者和出版社的正当权益和支益。

正在国家政策的撑持下,正在止业协会的引导下,相信出版业正在AI技术使用方面会得到更大效果。

校 对:马 葵

编 辑:陈 麟

复 审:张维特

末 审:宋 强

返回搜狐,查察更多