junhey / movie-recommendation-system

电影推荐系统
19 stars 7 forks source link

查重技巧 #5

Open junhey opened 6 years ago

junhey commented 6 years ago

知网标准是“连续13个字一模一样会被计入重复率”

查重:http://www.paperyy.com/

参考文章 https://www.zhihu.com/question/21109949

junhey commented 6 years ago

请务必努力写,努力写……三天后就熟能生巧了。 Ⅰ、对一些概念性的内容,因为很难有自己的观点,一不小心就容易大篇幅地引用,影响重复率,这种时候可以选择几种办法来避免重复。 ①同义词、近义词使用——基础功 把个人换成一个人、个体,或者使用代词其,把含义换成意思、内涵,把大部分换成大多数、很多、不少、多种……就是这条技巧的精髓。 单靠同义词转换当然不够,但同义词近义词是必备的基础功,请务必熟练。 ②句式变化。 放三个来自不同文献,差不多内容但是不同表述的段落,然后先通读一遍,能用自己的话概括出来就直接写,如果概括不出来,那么就把A段落的语句形式,掺入B段落的语句,再用C段落的顺序改一改,就出来了个混同的东西。 打个比方,A段落用的是 A段落:你的经验会随着完成的项目在递增,但如果不善于总结和分类别存储相关文件,即使是你曾经跟进的项目,也会随着时间慢慢流逝而淡出记忆。 B段落:合理、及时地总结存储相关文件是增加经验的良好途径,否则你只是在进行重复劳动。 C段落是“只有将……如何如何,才能……”的结构。 翻译结果:只有每次完成项目后将总结、归纳、分类、存储相关文件的工作做到位,才能够增加和提高你的工作经验,否则即使你亲身经手过无数个项目,也始终在原有基础上打转,无法得到能力上的提升。 所谓中翻中……差不多就是这个办法。请注意,如果你把这方法用在原创文学上会被认定为情节相似过度借鉴,但对我们这些只想混个过的苦逼学生来说,不失为一个取巧的办法。 PS:这个例子是临时在网上找的,有所不足之处请见谅。 ③适当使用反问,疑问句式。 概念往往都是陈述句,适当地用一些反问和疑问句式,如【这个问题在国际上怎么定义的呢?根据专家学者的观点/根据相关调查研究】,然后混个两三句。这个方法不能多用,毕竟是毕业论文,要求一定专业性,不可过分口语化。 ④善用“也就是说”,“即”,相当于将原话换个意思继续说。 如果概念或者原话是晦涩深奥的,用通俗一点的话翻译一遍,也就是用自己的话说一遍。如果概念本身已经很简洁明了了,看看能不能用半文半白的话讲一下。 以上这些技巧也可以用于全文写作里。

Ⅱ对于一些观点
①两句合一句的缩写法 原材料如果比较啰嗦的,赘余的可以尽量去掉,然后用尽量精炼的语言总结。 ②一句变两句三句的扩写法 正反两面说,原材料只写正面的,请补足反面,用上“反之”“相反的是”等等句式,反之亦然,只写反面的,自动补足正面。如果能举个例子,那当然再好不过。
③举例法 在看文献时要注意收集例子和案例,专门放一个文档,到时候想要编例子或者找案例都可以直接去这个文档里看。 原文没有例子的情况下,可以直接添加例子,用上在其他文献中看到的相关案例,注意要用自己的话描述,可以比较轻松又大幅度混一些字数。 如果原文有一个抽象概括的例子,那么直接用上一个具体的例子。比如原文是“在实行A制度的国家中……”,直接改成“对于XX国这样贯彻A制度的国家……” 总之,原文跟你讲规律规则,你就在改写的时候讲例子。原文给你举例子,你就在改写时尽量概括成规律规则的基本内容。 ④回头检查:两到三次乱语序 第一遍写的时候,为了尽量改得不一样,可能会不够注意整个语句的通顺程度,当改了一遍后,回头记得检查语句,把文章改得通顺,这样经过两次的语序调整,基本能达到面目全非效果。

注意事项:大部分情况下,请保证自己每段话都有两段话的参考量,不然查重有点危险。请保证自己总共至少有40篇(其中至少10篇以上硕博论文)的文献阅读量,不然三万字是怎么撑都撑不起来的。
如果开始中翻中的时候发现某段话只有一段参考内容怎么办?随便打开2-3篇还没看过的论文PDF,然后检索关键词,把相关内容copy下来,当作参考内容,开写。

junhey commented 6 years ago

需要刻意避开查重检测的论文,都是没有学术价值的垃圾论文。这种论文能否通过的关键是形式上合乎论文规范和字数要求,而不在于学术观点和论证逻辑。

因此,最佳方法就是,把查重标注的部分整句,整段的删掉,无需考虑删除后的逻辑连贯性,简便高效快捷。

junhey commented 6 years ago

查重原理 1、知网学位论文检测为整篇上传,格式对检测结果可能会造成影响,需要将最终交稿格式提交检测,将影响降到最小,此影响为几十字的小段可能检测不出。对于3万字符以上文字较多的论文是可以忽略的。 对比数据库为:中国学术期刊网络出版总库,中国博士学位论文全文数据库/中国优秀硕士学位论文全文数据库,国重要会议论文全文数据库,中国重要报纸全文数据库,中国专利全文数据库,个人比对库,其他比对库。部分书籍不在知网库,检测不到。
2、上传论文后,系统会自动检测该论文的章节信息,如果有自动生成的目录信息,那么系统会将论文按章节分段检测,否则会自动分段检测。
3、有部分同学反映说自己在段落中明明引用或者抄袭了其他文献的段落或句子,为什么没有检测出来,这是正常的。中国知网对该套检测系统的灵敏度设置了一个阀值,该阀值为5%,以段落计,低于5%的抄袭或引用是检测不出来的,这种情况常见于大段落中的小句或者小概念。举个例子:假如检测段落1有10000字,那么引用单篇文献500字以下,是不会被检测出来的。实际上这里也告诉同学们一个修改的方法,就是对段落抄袭千万不要选一篇文章来引用,尽可能多的选择多篇文献,一篇截取几句,这样是不会被检测出来的。 4、一篇论文的抄袭怎么才会被检测出来?知网论文检测的条件是连续13个字相似或抄袭都会被红字标注,但是必须满足3里面的前提条件:即你所引用或抄袭的A文献文字总和在你的各个检测段落中要达到5%。

如何避开被查出来 改写、改变句式 保留文章中的专业词汇,其它词语尽量变换同义词。
改变句型:比如把主动句改成倒装句、被动句。
一句话里连继10个字完全相符,则会被认为是抄袭,改写及改变句型能很好地避开。

选择从书籍中摘抄

各类论文检测系统对比的数据源主要是已发表论文、期刊、部分网络文章,很多书籍是没有包含在检测数据库中。之前朋友从一本研究性的著作中摘抄了大量文字,也没被查出来。就能看出,这个方法还是有效果的。

不能只摘抄一篇文章,应有多个来源。记得标注好参考文献 文稿中参考文献应放在中括号中[],系统就能识别出,计算相似度时不会算入。

junhey commented 6 years ago

抄你们使用的相应的抄袭检测系统数据库中没有的论文。

最简单的是 不要抄国内论文 或者直接抄书

抄论文的做好引用