跳转到内容

维基百科:机器人/申请/存档/2019年/未获批的申请

维基百科,自由的百科全书

This is an archive page. For new bot request, please to go Wikipedia:机器人/申请 and follow the instructions there.

  • (-)反对理由如下:
  1. WP:NFCC#3bWP:NFCC#8,且印象中AWB并不能显示图片,故不可能使用AWB简单查看源代码就能处理。
  2. 印象中申请人并未参与过多的文件巡查。检查最近的c区编辑及本地编辑也未能发现有足够的经验。故对此存在一定疑虑。

Catherine Laurence (discussion) 2019年10月3日 (四) 11:00 (UTC)

  • 我认为|image has rationale=yes主要检查的是图片合理使用的理据,对于您提到的3b和8就是巡查任务了,是通过点右下角的巡查按钮来实现的。而本分类中列出的文件都早已过了巡查期。另外3b有Wcam-bot一直在做。我自认我一直有巡查文件的能力,只是因为忙条目的巡查去了所以没管文件。@Catherine LaurenceRowingbohe 参与调查 / 台州专题 2019年10月3日 (四) 13:38 (UTC)
  • 状态 已过期
  • 操作者: 云间守望上海地铁25周年
  • 提请时间: 2018年6月16日 (六) 07:35 (UTC)
  • 自动化程度:全自动/有监督的半自动
  • 编程语言pywikibot的refLinks.py(做了一些小的修改,避免识别错误多加上一些模板。)
  • 用途:转换光秃引用(即仅有链接而连标题都没有的引用,以机器方式自动获取标题并加上注释),并将重复的引用使用自动生成的ref名称替换;同时若页面内没有<reference />一类的参考来源模板/wiki文字,则自动补上。
  • 源代码连结: 见Phab
  • 编辑时段及频率:不定
  • 受影响页面:大概几万个
  • 遵守机器人规范本案中无关
  • 已有机器人权限:

说明一下两个账户的关系:WQL-bot现在我将会用来进行全自动操作,因此未来会放到自己的服务器上去;而Yjsw-bot的操作全在自己电脑上,人工监视,设置阻塞防止刷屏。英文维基百科也曾用过相关脚本进行类似的操作,我认为是相对安全的。--云间守望上海地铁25周年 2018年6月16日 (六) 07:36 (UTC)

(?)疑问机器如何判断页面标题?--140.180.251.211留言2018年6月21日 (四) 03:30 (UTC)
李四阁下您好。该脚本判断来源为裸露的条件是类似以下的来源格式:<ref>[http://example.tld]</ref>
或者是这种:<ref>http://example.tld</ref>
以上两类会被认为是裸露的。这样子保证了“不做不该做的事情”。--云间守望 2018年6月21日 (四) 13:36 (UTC)
为何不替换成{{Cite web}}?--Xiplus#Talk 2018年7月6日 (五) 03:55 (UTC)
目前的机制是,若检测到链接存在且可访问,就给放进模板,若是死链接就标记{{dead link}},因为是现成程序改造,有点复杂。--云间守望 2018年7月6日 (五) 11:36 (UTC)
您的机器人会发生这种情况吗?--Xiplus#Talk 2018年7月6日 (五) 12:55 (UTC)
@Xiplus 难以避免,原因是一个网址在历经很长时间之后不能保证其依然为同一内容,亦或是链接向G11的内容。目前我的一切操作均人工监视人工确认。--云间守望 2018年7月6日 (五) 13:43 (UTC)
@WQL其实在下问的是“以机器方式自动获取标题……”这个如何做到?--140.180.252.94留言2018年7月6日 (五) 21:00 (UTC)
把外部页面load一次不就好了?JC1 2018年7月12日 (四) 16:43 (UTC)
建议互助客栈提一下,若无人反对将会批准。另上面提到的问题,若有人工监视确认倒是没问题,但若要转为全自动,将需要着手处理。--Xiplus#Talk 2018年7月15日 (日) 11:02 (UTC)
感谢,我会去提下。我现在选择该机器人的一切动作半自动。--WQL留言2018年7月17日 (二) 06:50 (UTC)
请求已过期 。--Xiplus#Talk 2018年7月31日 (二) 10:32 (UTC)
操作者重开请求。--Xiplus#Talk 2018年8月22日 (三) 06:21 (UTC)
操作者声明已经退出维基百科,而且bot账号是被封的....--百無一用是書生 () 2018年8月22日 (三) 06:45 (UTC)
退出维基百科,但是没退出其他计划。这个机器人未来有打算在其他维基计划里使用。被封用途与申请用途完全无关。--Mend My Way 2018年8月25日 (六) 11:32 (UTC)
@WQL如果您没打算在本地运行机器人,该请求将关闭,否则请说明一下目前进度如何。--Xiplus#Talk 2018年8月25日 (六) 11:41 (UTC)
我说“但是没退出其他计划”说明这个机器人若未来在中文维基百科运行将会持续维护。目前,机器人已经就绪。--Mend My Way 2018年8月25日 (六) 12:11 (UTC)
应要求,在WP:VPD开讨论,请关注。--Mend My Way 2018年8月25日 (六) 12:39 (UTC)
Wikipedia:互助客栈/条目探讨/存档/2018年9月#关于转换“光秃引用”机器人的意见征求。经过了七日公示,请确认。--Mend My Way 2018年9月1日 (六) 14:06 (UTC)
批准测试运作(50次编辑)--Xiplus#Talk 2018年11月4日 (日) 15:26 (UTC)
添加缺少的<references />标签这一项已经测试完成,见Special:Contribs/Yjsw-bot;裸露引用相关依然在测试中测试已经完成。(备注:WQL-bot这个号还没有被解封)。--Mend My Way 2018年11月9日 (五) 15:12 (UTC)
如果您想要用Yjsw-bot执行,那么请把最上方章节名称改掉,以及移动本页。--Xiplus#Talk 2018年11月9日 (五) 15:50 (UTC)
这是权宜之举,我依然在等待相关账号解封,而且我的机器人配置里也写明了使用申请中提到的账号。--Mend My Way 2018年11月9日 (五) 16:27 (UTC)
您应该自行请求解封,BAG(即使有管理员身份)不会帮您做这件事。--Xiplus#Talk 2018年11月10日 (六) 00:01 (UTC)
测试完成,在测试的时候发现了一些问题,修改了一处程序,以保证标题中含有|时候能够处理到位。 --Mend My Way 2018年11月10日 (六) 16:02 (UTC)
@WQL您的机器人于2010年ATP世界巡回赛总决赛中,将File:R federer.jpg|thumb|right替换成File:R federer.jpg|缩略图|右,个人认为没坏别修,而且好像没必要修正。 Willy1018(留言) 2018年11月11日 (日) 04:16 (UTC)
似乎是我开了一个叫做cosmetic change的功能,我给关掉了。--Mend My Way 2018年11月11日 (日) 04:27 (UTC)
Special:Diff/51973324,抓到死连的标题?Special:Diff/51973399看起来比reFill差?--Xiplus#Talk 2018年11月17日 (六) 06:14 (UTC)
@WQL?—— Eric Liu 坐等万次编辑留言留名学生会 2019年5月22日 (三) 06:52 (UTC)
WQL?--MCC214#ex umbra in solem 2019年6月10日 (一) 07:16 (UTC)
抱歉,很久没上线了。我在测试运作完成后,并未接获其他指示,故暂没有回应。如果有相关疑问,请在我的用户讨论页面提醒。--云间守望 2019年6月10日 (一) 13:16 (UTC)
你开不开修pdf的功能?如果不开问题很简单,直接用citoid就好了,你可以自己安装一个,或是使用wmf提供的,注意检查返回结果编码是否正常(比如有没有包含U+FFFD)避免重蹈ve的覆辙;如果开的话你可以把源码里的GET请求改成HEAD,如果Content-type是application/pdf的话还用程序原来的逻辑处理,是text/html的话丢给citoid,否则扔掉。--Antigng留言2019年6月14日 (五) 17:32 (UTC)
@WQL?—— Eric Liu留言留名学生会 2019年9月12日 (四) 04:00 (UTC)
机器人操作者已经隐退,故应可关闭此请求。 Willy1018(留言) 2019年10月30日 (三) 11:18 (UTC)
请求已过期。--Xiplus#Talk 2019年10月30日 (三) 11:20 (UTC)
  • 状态 已过期
  • 操作者: 砜中嘌呤的白磷萃取 打谱
  • 提请时间: 2019年4月8日 (一) 12:53 (UTC)
  • 自动化程度:全自动
  • 编程语言Python
  • 用途:清理条目页模板参数名前后的不换行空格
  • 源代码连结: 还没写
  • 编辑时段及频率:<=10/min
  • 受影响页面:条目页,粗略名单可搜 insource:/\{\{[^}]+ [  ]*\=/
  • 遵守机器人规范不相关
  • 已有机器人权限:
MediaWiki 不会把参数名中的不换行空格当作普通空格,导致很多模板无法正常显示参数,且人工很难发现这样的问题。phab:T22076 似乎遥遥无期。 --砜中嘌呤的白磷萃取 打谱 2019年4月8日 (一) 12:53 (UTC)

这边有写过类似的功能,但没有完全相同的。有2点或可注意:

  1. 采用insource:/.../搜寻可能找不齐所有出问题的条目。
  2. 我猜出这种问题的条目比率不太高。

--Kanashimi留言2019年5月27日 (一) 09:21 (UTC)

@WhitePhosphorus还有要测试吗? --Kanashimi留言2019年9月12日 (四) 15:34 (UTC)
请求已过期,还请准备好测试后随时重开。--Jimmy Xu 2019年12月13日 (五) 22:47 (UTC)
  • 第一部分将条目中的模板及嵌套关系提取出来。为正确地判断“|”、“=”等符号的含义,在解析模板的过程中还会检查内链、注释和部分会导致维基语法失效的标签(如nowiki、math、pre等)的状态。此外,如果在提取过程中发现子模板已经损坏或者这个程序处理不了,则会将其所有的母模板标记为损坏。条目中有任何一个模板损坏,或者正文结束时内链、注释、标签的状态不正常,则不会转入第二部分。(经测试,主名字空间中有0.2%的页面会遇到此问题,其中绝大多数是由语法错误造成的,例如此页面)关于提取模板的功能的测试参见12
  • 第二部分调用tempgroom函数(源码已附)“梳理”前一部分获得的每一组模板。首先利用递归遍历每一个模板。然后依次检查:如果模板已损坏,不处理;不是引用模板,不处理;没有模板参数,不处理。然后检查有无待处理的“accessdate”和“archivedate”参数(满足:1、(除去空格、常见控制符和注释之后的)参数名相符;2、有参数值;3、该参数处没有引出子模板)。如果模板中有且仅有一个满足条件的“accessdate”参数,则检查(除去空格、常见控制符和注释之后的)参数值是否符合“xxxx-xx-xx”的格式。如果不符,利用Wikipedia:机器人/申请/Antigng-bot/11中的函数(在此基础上增加了对中文月份的支持)提取“年、月、日”。如果:

  1. 负责转换的函数没有报错
  2. 得到了大于2000的年份
  3. 没在参数中发现诸如“xx期”的字样
  4. 如果有月份,则月份数在1-12之间
  5. 如果有日数,日数在1-31之间,且有月份。

  • 则用规范的年月日格式代替老格式。对“archivedate”参数采取类似的方法处理。如果模板被梳理,或任何一个子模板被梳理过,则返回1,否则返回0。
  • 第三部分将模板放回页面的源代码中,如果1、第一部分没有发现任何错误;2、第二部分至少有一个模板梳理过,则提交编辑。
  • 有且仅有第二部分中“提取年月日”的部分可能出错,因为所涉对象是自然语言,不可能穷尽所有可能性。但从测试结果来看似乎并发现没有问题。
  • 70次测试编辑。除本次编辑由于没有检查参数值是否为空(已修正)而导致错误外,其它编辑均符合设计要求。
Old discussions...
  1. 负责转换的函数没有报错
  2. 没在参数中发现诸如“xx期”的字样
  3. 得到了大于2000的年份,在1-12之间的月份和在1-31之间的日数

--Antigng留言2019年6月2日 (日) 03:07 (UTC)

正规化日期格式似乎没有共识?--Xiplus#Talk 2019年7月4日 (四) 13:14 (UTC)
那个讨论串里也只是有人想用xxxx年x月x日这种格式,排除掉就好了。--Antigng留言2019年7月4日 (四) 16:27 (UTC)
这个工作是修复出错的参数,还是会全面正规化参数?--Xiplus#Talk 2019年7月7日 (日) 04:37 (UTC)
@Antigng? --Kanashimi留言2019年9月12日 (四) 15:36 (UTC)
@Antigng?—— Eric Liu 留言留名学生会 2019年11月12日 (二) 08:47 (UTC)
请求已过期,如仍欲执行此任务请随时重开。--Jimmy Xu 2019年12月13日 (五) 22:51 (UTC)
批准测试运作(50次编辑)。--Xiplus#Talk 2020年10月26日 (一) 01:27 (UTC)
完成无误--Antigng留言2020年10月30日 (五) 11:51 (UTC)
 正式批准运作。--Xiplus#Talk 2020年11月2日 (一) 23:46 (UTC)
@-Zest有测试结果或报告吗? --Kanashimi留言2019年9月12日 (四) 15:44 (UTC)
请求已过期,请凭测试结果随时重开。--Jimmy Xu 2019年12月13日 (五) 23:03 (UTC)
  • 状态 已过期
  • 操作者: -Zest
  • 提请时间: 2019年4月4日 (四) 21:19 (UTC)
  • 自动化程度:
  • 编程语言AWB
  • 用途:\<\?[Pp]\>变成\r\n
  • 源代码连结:
  • 编辑时段及频率:20/m
  • 受影响页面:2000
  • 遵守机器人规范基本上无关
  • 已有机器人权限:Y
  • p不知道何时会被不支援,目前是列入Lint里面。
  • 可以讨论的点,是否\r\n就好,还是有需要用br而不用\r\n的情况?

--Zest 2019年4月4日 (四) 21:19 (UTC)

排除模板之类中的可能比较保险? --Kanashimi留言2019年4月25日 (四) 10:26 (UTC)
@-Zest有测试结果或报告吗? --Kanashimi留言2019年9月12日 (四) 15:41 (UTC)
请求已过期,请凭测试结果随时重开。--Jimmy Xu 2019年12月13日 (五) 23:03 (UTC)
  • 状态 撤销许可
  • 操作者: -Zest
  • 提请时间: 2019年2月24日 (日) 20:50 (UTC)
  • 自动化程度:全自动与半自动
  • 编程语言awb
  • 用途:Linter obsolete tag
  • 源代码连结:
  • 编辑时段及频率:20/1m max
  • 受影响页面:于下
  • 遵守机器人规范N
  • 已有机器人权限:Y
  • 以<center>方面,将做出以下修正
    • 1:<center><gallery>...</gallery></center>→<gallery class="center">...</gallery> (1200+)
      • 以上適用於<gallery>、<categorytree>、<poem>、<pre>、<syntaxhighlight>、<source>(400)
      • 以上不适用于<hiero>、<math>、<score>、<timeline>
    • 2:表格的| <center>xxxx</center>会替换为|style="text-align: center;" | xxxx (3800+)
    • 3:<center>包围表格,改为{| style="margin: 1em auto;" (2000-)
  • 4:以<span>方面,将做出以下修正
    • color、face、size这三个修改为span style(19000+、11000+、40000+)
此任务先这两个 其他另外申请。-Zest 2019年2月24日 (日) 20:50 (UTC)
最后一个是 <font> 下面的属性吧?看上去基本没有问题。表格的 center 修改语义不是完全一致,但也挺好的。(我不活跃这么久不能批准吧)——Artoria2e5 讨论要完整回复请用ping 2019年4月15日 (一) 14:39 (UTC)
每项各 批准测试运作(30次编辑)。--Xiplus#Talk 2019年4月27日 (六) 23:49 (UTC)
@-Zest有测试结果或报告吗? --Kanashimi留言2019年9月12日 (四) 15:38 (UTC)
请求已过期,请凭测试结果随时重开。--Jimmy Xu 2019年12月13日 (五) 23:04 (UTC)

第一项 正式批准运作。--Xiplus#Talk 2020年10月26日 (一) 08:19 (UTC)
撤销许可。--Xiplus#Talk 2022年10月11日 (二) 09:31 (UTC)
  • DiBabel bot will copy templates and modules from mediawiki.org to all other sites/languages listed in Wikidata for that page, automatically changing the template and module names.
  • It will be copied ONLY if Wikidata item has "instance of" set to 维基媒体多网站页面 (Q63090714).
  • It will be copied ONLY if the current content of the page exists in the history of mediawiki.org's (origin) version. E.g. if a user modifies English version of the page, it will not be overwritten unless that exact text ever existed in the history of the page on mediawiki.org. To resume automatic synchronization, a user must copy the latest version of the page from mediawiki.org. Note that simply reverting a page to an older version will not be enough to prevent a bot from copying it again. A page has to be different from any of origin's revisions (e.g. add a note why the page was modified).
  • Any template names will be automatically localized inside the wiki markup, e.g. {{MW name|...}} text will become {{Localized name|...}}, as long as Template:MW name exists on mediawiki.org, and it has a corresponding template on the destination wiki. Shared templates should not use non-shared templates, as that may cause unexpected results.
  • Just like templates, modules text require('Module:MW name') will be converted to require('Module:Localized name').
  • 讨论内容连结: wishlist proposal
  • 源代码连结: PyWikiAPI + https://github.com/nyurik/dibabel
  • 编辑时段及频率:a few times a day
  • 受影响页面:10-15 -- depending how widely the community wants to use it
  • 遵守机器人规范No: the bot will copy anything from MW.org to enwiki, as long as that page is tagged for its operation. If a user modifies enwiki's version in any way, including adding a {{bot}} flag, the bot will not override it because it will not match any of the page's revision history on mw.org. On the other hand, if mw.org has a shared page with the {{bot}}, that content will be copied as is, because that's the intention of the page's author.
  • 已有机器人权限:ruwiki, possibly a few more already granted botflag
I sent a notice on the Village pump. Waiting for discussion. --Xiplus#Talk 2019年5月4日 (六) 13:35 (UTC)
批准测试运作(10次编辑) --百無一用是書生 () 2019年5月17日 (五) 11:40 (UTC)
@Yurik? --Kanashimi留言2019年9月12日 (四) 15:39 (UTC)
So far it is on pause - I am thinking of re-making this tool as a user-tool, where the user will be able to view the diffs and one-click distribute it to the specific language. I do plan to run the tool a few more times to keep already existing things in sync. --Yurik留言2019年9月12日 (四) 15:45 (UTC)
@Yurik So you will make another request in the future? --Kanashimi留言2019年9月12日 (四) 15:52 (UTC)
Request Expired. Jimmy Xu 2019年12月13日 (五) 23:04 (UTC)
  • 状态 已过期
  • 操作者: Arnie97留言
  • 提请时间: 2018年8月25日 (六) 17:36 (UTC)
  • 自动化程度:半自动
  • 编程语言Python
  • 用途:建立 IATA、ICAO 机场代码的重定向
  • 源代码连结: airport.py
  • 编辑时段及频率:一次性
  • 受影响页面:不修改现存页面
  • 遵守机器人规范无关
  • 已有机器人权限:
  • 准备工作:是否应先建立一个分类?中文维基目前没有 en:Template:R from airport code
  • 运作流程:
  1. 遍历主命名空间中嵌有 {{Infobox airport}} 的条目。
  2. 对于每个条目,读取模板中填写的三字码和四字码。
  3. 如果已存在与机场代码名称相同的的条目,不进行任何操作。
  4. 否则,建立从机场代码指向机场条目的重定向。—以上未签名的留言由Arnie97对话贡献)于2018年8月25日 (六) 17:51 (UTC)加入。
  • (-)倾向反对,怎么可以根据条目中的红链,全自动地建立三个英文字母构成的重定向呢?且不考虑用户填错、笔误的可能性,三个英文字母可以是很多东西的缩写,比如JFK,可以指肯尼迪这个人,也可以指机场。没有人的干预,机器人不可能知道这种歧异存不存在。--Antigng留言2018年8月27日 (一) 00:42 (UTC)
  • @Arnie97有任何回应吗?--Xiplus#Talk 2018年11月4日 (日) 15:27 (UTC)
  • @Arnie97试试再PING--Temp3600留言2018年11月17日 (六) 15:02 (UTC)
    • 关于用户填错的可能性,可改用可信的外部参考来源。歧义的处理我没有很好的想法,根据抽样测试,的确涉及到不少歧义,欢迎各位献策。现在有两个不完善的思路:
      1. 搜索其他条目的首段或全文中是否存在此词;如果检查全文,则标题中含有机场、航点等词的条目除外;
      2. 检查英文维基的同名页面是否是机场代码重定向;
      ——Arnie97留言2018年11月18日 (日) 03:17 (UTC)
第一点可能有判别错误的问题。就第2点而言,还必须确认英语维基的重定向目标正是这个机场。 --Kanashimi留言2018年12月3日 (一) 21:42 (UTC)
@Arnie97有测试结果或报告吗? --Kanashimi留言2019年9月12日 (四) 15:42 (UTC)
请求已过期,请随时凭测试结果重开。--Jimmy Xu 2019年12月13日 (五) 23:06 (UTC)

功能就是把<font>[[link]]</font>换成[[link|<font>link</font>]]开 flood 跑过两百来个没出问题,因为觉得不是一次性工作(除非用过滤器拦下)所以还是来申请机器人了。Xiplus 说可以顺便把已弃用的 font 换成 span,我也打算弄,当然这样正则表达式会写得保守一些。 --砜中嘌呤的白磷萃取 打谱 2018年3月11日 (日) 14:45 (UTC)

我觉得听Xiplus的话,更一劳永逸一些--百無一用是書生 () 2018年3月12日 (一) 11:39 (UTC)
反对。Tidy将要或者已经被换成了HTML5那套东西(还记得换了之后空标签的事情吗?),现在搞tidy bug是脱裤子放屁。——Artoria2e5 讨论要完整回复请用ping 2018年3月19日 (一) 07:37 (UTC)
鬼啦,原来是把tidy换掉之后会丢失颜色啊(mw:Help:Extension:Linter/tidy-font-bug)……那我支持吧。——Artoria2e5 讨论要完整回复请用ping 2018年3月19日 (一) 07:40 (UTC)
@WhitePhosphorus所以有要替换font为span吗?--Xiplus#Talk 2018年4月2日 (一) 08:43 (UTC)
phab:T175706以及[2]:今年7月底将完成 Tidy2RemexHTML。这个bot任务还有必要么?--百無一用是書生 () 2018年4月2日 (一) 13:40 (UTC)
@Xiplus替换成 span 的脚本也写好了,一个小测试。用fixtidyfont.py --dry --pageid PAGEID可以针对单一页面进行测试(要求 python>=3.6,安装 BeautifulSoup。botsite.py 可以从我机器人代码下载)。这里各种奇怪的情况都考虑了——只是白名单里只有十六种颜色,没纳入 X11 colors。
必要性的问题 IRC 群里说过了,WMF 等着社群自己修复错误,所以有必要。 --砜中嘌呤的白磷萃取 打谱 2018年4月2日 (一) 15:34 (UTC)
@WhitePhosphorustestcase里正常的size跟奇怪的size两章节没有替换到?--Xiplus#Talk 2018年4月6日 (五) 00:42 (UTC)
因为它没有触发要修的那个 LintError。所以要顺便把页面里的 font 都换成 span?这样感觉修Special:LintErrors/obsolete-tag又只修一半有点怪怪的。 --砜中嘌呤的白磷萃取 打谱 2018年4月6日 (五) 01:04 (UTC)
@WhitePhosphorus就按原先申请范围进行吧, 批准测试运作(50次编辑)。--Xiplus#Talk 2018年4月8日 (日) 03:21 (UTC)

@Xiplus 测试已完成贡献),发现两个问题。

  1. 把Deeppink当成十六进制编码,这个是我正则前后忘加^和$导致的,已修正。
  2. 会把链接里的<br>等标签的左右括号转义掉(12)。这个应该是 BeautifulSoup 库的问题,我得再想想怎么规避。 --砜中嘌呤的白磷萃取 打谱 2018年4月8日 (日) 16:08 (UTC)
请求已过期,如仍欲进行此任务,请随时重开请求。--Jimmy Xu 2019年12月13日 (五) 23:07 (UTC)