多家AI公司绕过网络标准抓取出版商网站内容 没有授权也阻止不了

IT之家 6 月 24 日消息,据路透社上周六报道,专注于“内容许可”领域的初创公司 TollBit 近日向新闻出版商发出警告称,多家人工智能公司正在 规避 出版商用来阻止抓取内容的 常见网络标准 ,并将抓取的内容用于 训练生成式 AI 系统

这一消息是在 AI 搜索初创公司 Perplexity 与媒体《福布斯》之间就同一网络标准公开争执的背景下发出的。当前,科技和媒体公司之间正在就 生成式 AI 时代的内容价值 展开更广泛的辩论。

Tollbit 将自己定位为 内容匮乏的 AI 公司 愿意与他们达成重大许可协议的出版商 之间的“媒人”。

IT之家注:《福布斯》曾指责 Perplexity 在 AI 生成的摘要中 剽窃其报道内容 ,然而前者 并未标注 消息来源,也没有获得《福布斯》的许可。

另外,《连线》(Wired)杂志上周也发表了一篇调查报道并指出,Perpexity 可能 绕过了 (新闻出版商设置的)“机器人排除协议(Robots Exclusion Protocol)”或其他阻止网络爬虫的程序。

图源 Pexels

自称 代表 2000 多家美国出版商 的贸易组织“新闻媒体联盟”也对这一行为表示担忧 ——AI 公司对出版商设置的“禁止抓取”机制或“robots.txt”等工具置若罔闻。该组织主席 Danielle Coffey 表示,“如果 AI 公司无法停止大规模抓取的话,我们就 无法通过 有价值的内容获利,也无法为记者们 支付报酬 。”

Tollbit 表示,Perplexity 并不是唯一无视出版商网站“禁止抓取”机制的违规者。根据其分析,“大量”AI 平台绕过了这一机制,而该机制为 AI 平台抓取自家内容设置了一份“ 白名单 ”—— 指示其网站哪些部分可以被抓取。

包括《纽约时报》在内的一些出版商已就这些侵权行为 起诉 AI 公司 。其他出版商则与人工智能公司签署了许可协议,AI 公司们也愿意为内容付费,尽管双方往往对材料的价值存在分歧。许多 AI 开发者认为,他们免费获取内容 并未违反任何法律


Fe和Al制作的容器能装哪种浓溶液

浓的,冷的硫酸和硝酸

搜索引擎发展历程?谁知道具体的

1990年:第一个互联网上的搜索引擎Archie出现,用于搜索FTP服务器上的文件。 1993年:6月,第一个Web搜索引擎World Wide Web Wandere出现,它只用来收集网址。 10月,第二个Web搜索引擎ALIWEB出现。 开始索引标题标签等信息。 1994年:1月,早起最重要的搜索引擎之一Infoseek创立。 (网络创始人李彦宏就是其核心工程师之一)4月,雅虎Yahoo!创立。 同月,第一个全文搜索引擎(索引文件全部内容)WebCrawler推出。 6月,Lycos创立。 迅速成为最受欢迎的搜索引擎之一。 1995年:4月,雅虎Yahoo!正式成立。 12月,Infoseek成为网景浏览器的默认搜索引擎。 同月,Alta Vista创立,迅速成为搜索引擎发展中最受欢迎的,堪称当时的谷歌Glloge。 1996年:4月,雅虎Yahoo!上市。 1997年:4月,Ask Jeeves上线,唯一一个至今仍真实存在并有一定市场份额的早起搜索引擎。 1998年:9月,谷歌Google正式成立。 1999年:6月,曾经流行一时的搜索引擎Infoseek消失。 2000年:1月18日:网络成立。 7月,雅虎Yahoo!使用谷歌Google搜索数据。 2001年:10月,网络作为搜索引擎正式上线。 2002年:3月,谷歌Google Adwords 推出PPC形式,也就是按点击付费。 2003年:7月,雅虎Yahoo!将除了谷歌Google之外的几乎所有主流搜索技术收归旗下。 2004年:8月,谷歌Google上市。 2005年:8月,网络上市。 2006年:9月,MSN网络品牌全部改为Live、并做了大量推广,Google仍然占最大地位。 2007年:3月,谷歌Google开始提供类似网站联盟的按转化付费的广告形式。 2009年:6月,微软Live Search 改名为必应(Bing)7月29,雅虎Yahoo!被自己亲手培养的Google谷歌彻底打败在搜索引擎战场。 2010年:8月,Yahoo!雅虎开始使用必应Bing搜索数据。 2011年:2月,Google谷歌推出Panda更新,旨在减少搜索结果中低质量页面。 对seo优化业绩影响深远。 2010年8月,NetMarketShare 统计数据,全球搜索引擎市场份额中谷歌Google占据�.73,占世界绝对领先地位,网络由于中国搜索用户数量庞大,搜索量排在第三位。 但是国外使用网络者很少。

请问图书行业的主渠道和二渠道具体指什么?

一、主渠道是指通过新华书店等传统国营批销中心发行的通道;主渠道的优势:主动性强;覆盖面广;便于及时获得反馈信息。 二、二渠道是指除主渠道以外的其他发行渠道,主要是民营的图书批发和零售通道。 还有“特殊渠道”指网上书店、系统发行、机场等新兴的发行渠道。 扩展资料:教辅图书的发行方式可分为:直接渠道,间接渠道,特殊渠道三种模式。 一、直接渠道教辅图书发行直接渠道也称“直销”,是出版单位将出版物直接销售给消费者的渠道,可分为无推销机构和有推销机构两种形式。 无推销机构是指:出版单位直接将出版物通过传统批销渠道销售到消费者手中,中间不存在推销人员和推销机构的参与行为,如:新华书店,等,传统渠道一般为国有机构。 有推销机构是指:通过直销人员或直销机构促成销售目的的销售行为,如:河北、山东、北京的教辅直销大军,从业人员高达5-6千人之多,直接上门与全国各学校联系业务,直销机构一般为私企性质。 教辅图书直接渠道的优势:主动性强;覆盖面广;便于及时获得反馈信息。 教辅图书直接渠道的不足:资源分散;不利于形成良好的产销关系;存在退换货制约;投入高。 二、间接渠道教辅图书发行间接渠道是指:出版单位通过出版物发行商将出版物销售给消费者的汇道,教辅书籍间接渠道发行可分为以下几中形式:出版单位/发行商——零售商——消费者。 出版单位/发行商——批发商——零售商——消费者。 出版单位/发行商——总发行单位——批发商——零售商——消费者。 出版单位/发行商——总发行单位——零售商——消费者。 间接渠道的优势:分销广泛;促进分工与协作;节约资金;全面采集市场信息。 间接渠道的不足:特定条件下会增加发行成本;出版单位控制渠道能力降低;可能传递失真信息。 三、特殊渠道教辅图书发行特殊渠道是指:利用非正常发行模式达到销售目的的行为路径。 1:系统订购:多指主管部门统一给所辖范围内批量订购的行为,如教育、安全、质检、消防、医疗等部门。 2:代理商:通过代理商促成交易。 代理商制度也是教辅图书行业广为采纳的销售制度。 3: 实体书店:能快速与用户取得联系并看到实质图书,相当于出版社/商的零售点。 4:网上书店:随着网络的普及,网络的快捷和方便逐步被人们所认知,新兴的网购正在冲击传统购物方式,一些大型网上书籍发行书店如雨后春笋般出现,其中比较出名的网络发行公司如有:亚马逊、京东商城等,专业的教辅图书网站有:中国教学资料发行中心等。 5:图书交易会:利用教辅图书会展期间达成购买意向或购买行为。 教辅图书行业内每年都有几十场大大小小的交易会,最具代表性如北京书会展、长沙图书交易会、成都书交会等。 6:机场发行:多指国外销售方式,利用候机时刻构成销售的行为,当然需要航空公司的配合与支持。 参考资料:教辅图书发行渠道_网络百科

  • 声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
  • 本文地址:https://120.77.238.70/keji312/37813.html
风 国潮 宝岛年轻人 圈粉
暂无