python-openxml / python-docx

Create and modify Word documents with Python
MIT License
4.5k stars 1.11k forks source link

How to add some Chinese text into a paragraph successfully? #385

Open frenet opened 7 years ago

frenet commented 7 years ago

python Environment:

Windows 7 64bit, Anaconda2-4.3.1-Windows-x86_64.exe, python_docx-0.8.6

python code

from docx import Document from docx.shared import Inches

document = Document() p = document.add_paragraph(someChineseText)

content of the someChineseText will be shown in the end of the text

Errors happened as follows:

Traceback (most recent call last): File "D:\eclipsebackup\eclipse-cpp-oxygen-M5-win32-x86_64\eclipse\plugins\org.python.pydev_5.5.0.201701191708\pysrc_pydevd_bundle\pydevd_exec.py", line 3, in Exec exec exp in global_vars, local_vars File "", line 1, in File "C:\Anaconda2\lib\site-packages\docx\document.py", line 63, in add_paragraph return self._body.add_paragraph(text, style) File "C:\Anaconda2\lib\site-packages\docx\blkcntnr.py", line 36, in add_paragraph paragraph.add_run(text) File "C:\Anaconda2\lib\site-packages\docx\text\paragraph.py", line 37, in add_run run.text = text File "C:\Anaconda2\lib\site-packages\docx\text\run.py", line 163, in text self._r.text = text File "C:\Anaconda2\lib\site-packages\docx\oxml\text\run.py", line 104, in text _RunContentAppender.append_to_run_from_text(self, text) File "C:\Anaconda2\lib\site-packages\docx\oxml\text\run.py", line 134, in append_to_run_from_text appender.add_text(text) File "C:\Anaconda2\lib\site-packages\docx\oxml\text\run.py", line 143, in add_text self.flush() File "C:\Anaconda2\lib\site-packages\docx\oxml\text\run.py", line 165, in flush self._r.add_t(text) File "C:\Anaconda2\lib\site-packages\docx\oxml\text\run.py", line 41, in add_t t = self._add_t(text=text) File "C:\Anaconda2\lib\site-packages\docx\oxml\xmlchemy.py", line 275, in _add_child setattr(child, key, value) File "src\lxml\lxml.etree.pyx", line 1031, in lxml.etree._Element.text.set (src\lxml\lxml.etree.c:53208) File "src\lxml\apihelpers.pxi", line 715, in lxml.etree._setNodeText (src\lxml\lxml.etree.c:24403) File "src\lxml\apihelpers.pxi", line 703, in lxml.etree._createTextNode (src\lxml\lxml.etree.c:24266) File "src\lxml\apihelpers.pxi", line 1443, in lxml.etree._utf8 (src\lxml\lxml.etree.c:31485) ValueError: All strings must be XML compatible: Unicode or ASCII, no NULL bytes or control characters

content of the someChineseText

someChineseText='中美未来的科研潜在贡献度和潜在引领度分析冷伏海1 赵庆峰2,3 周秋菊 11. 中国科学院科技战略咨询研究院 北京1001902.山东科技大学计算机科学与工程学院 青岛2665903.中国科学院文献情报中心 北京100190各国在100个热点前沿和80个新兴前沿的表现大致反映了各国在世界科研前沿布局中的态势。这些分析主要是依据贡献度和引领度指标的比较来实现的。如何聚焦国家在未来的表现,以前瞻的视角进一步揭示前沿范围内不同国家的未来贡献和表现也是值得关注的重要问题。而潜在贡献度和潜在引领度恰恰能够从另一个侧面帮助我们寻找这个问题的答案。1 农业、植物学和动物学领域在农业、植物学和动物学领域,中国和美国在所有10个研究前沿中均贡献了施引论文和署名通讯作者的施引论文(详见附表1-I)。具体而言,在“食品检测中的高光谱成像技术”、“子囊菌和半知菌的分类学与系统发育学”和“抗氧化肽的分离与表征”3个研究前沿,中国贡献的施引论文数量和署名通讯作者的施引论文数量均排名第1,表现了最强的潜在贡献度和潜在引领度。这两项指标美国均排名2-7位,与中国的表现有一定差距。在美国领跑的“生鲜食品微生物污染的爆发与防控”、“细菌VI型分泌系统的结构与调控”、“营养物质纳米乳递送系统”、“田间高通量作物根系表型分析”和“蝙蝠白鼻综合症”5个研究前沿,以及中国领跑,美国处在并跑位置的“植物先天免疫机制”研究前沿,美国贡献的施引论文数和美国署名通讯作者的施引论文数均排名第1。可见美国在这6个研究前沿优势突出,表现了最强的潜在贡献度和潜在引领度。在这6个前沿中,除“蝙蝠白鼻综合症”研究前沿,中国贡献的施引论文和署名通讯作者的施引论文排名均在2-5位之间,也表现了较强的潜在贡献度和潜在引领度。而在“光合作用捕光蛋白复合物的结构与功”研究前沿,美国和中国贡献的施引论文和署名通讯作者的施引论文排名分别是第2和第3,两国在该前沿表现了相近的潜在贡献度和潜在引领度。2 生态学和环境科学领域在生态学和环境科学领域,中国和美国在所有12个研究前沿中均贡献了施引论文和署名通讯作者的施引论文(详见附表1-II)。美国依然表现抢眼,具体而言,在“海洋环境中的塑料微粒污染”、“生态系统服务”、“两栖类动物的传染性疾病:壶菌病的生态学研究”、“生物多样性丧失和生态系统的变化”、“溴系阻燃剂对环境的影响及其替代者有机磷阻燃剂”、“全球性汞污染”、“β多样性”、“生态物种形成的遗传学和基因组学研究”和“系统性的杀虫剂(烟碱和氟虫腈)对非目标生物及环境的影响”9个前沿美国贡献的施引论文数和署名通讯作者的施引论文排名均占据了第1的位置,表现了最强的潜在贡献度和潜在引领度。进一步显示了其在生态与环境科学领域的优势。由于地域性问题的原因,在“福岛核事故对环境的影响”前沿我们关注的两项指标美国均排名第2,中国均排名第4,也同样表现出了一定的潜在贡献度和潜在引领度。同样值得关注的是,在中国领跑的“土壤重金属污染”热点前沿,中国以施引论文排名和署名通讯作者的施引论文排名两个第1,赢得了最强的潜在贡献度和潜在引领度。在该领域美国则表现稍弱,贡献的施引论文排名第3,署名通讯作者的施引论文排名第8。3 地球科学领域在地球科学领域,美国优势明显,表现依然抢眼,在12个前沿中,有11个前沿美国贡献的施引论文均排名第1,另外一个排名第2。并且在10个前沿中美国署名通讯作者的施引论文排名第1,另外二个排名第2。可见美国在地球科学领域整体上表现了最强的潜在贡献度和潜在引领度。中国在施引论文的贡献方面优于核心论文的贡献方面。在10个前沿均有施引论文和署名通讯作者的施引论文贡献(详见附表1-III)。值得关注的是,在“高亚洲冰川质量变化研究”前沿,中国贡献了施引论文456篇,排名第2。其中365篇中国署名通讯作者,排名第1,中国在该前沿表现了较强的潜在贡献度和最强的潜在引领度。中国在“北极放大效应与中纬度极端天气的关系”、“土壤碳循环对气候变化的响应”、“气候系统模式研究”、“2011年东日本大地震与海啸成因研究”、“内陆水域和海洋的碳循环”5个前沿贡献的施引论文排名均在3-6位,署名通讯作者的施引论文排名均在2-3名,表现了较强的潜在贡献度和潜在引领度。在其他6个热点前沿,中国贡献的施引论文数排名和署名通讯作者的施引论文均排在4名之后,潜在贡献度和潜在引领度表现一般。4 临床医学领域在临床医学领域,美国的优势同样明显。美国在临床医学领域的28个前沿的施引论文和美国署名通讯作者施引论文数均排名第1位,足以表明美国在临床医学领域热点前沿的潜在贡献度和潜在引领度的国际竞争中取得了绝对优势(详见附表1-IV)。值得关注的是,美国没有拿到冠军的前沿“禽流感病毒的流行病学、病理学和遗传学研究”和“长链非编码RNA MALA T1促进癌细胞的增殖和转移”恰恰是中国在临床医学领域抢占领跑位置的2个前沿,中国不仅在贡献的核心论文和署名通讯作者的核心论文上取得了双料冠军,同样在中国贡献的施引论文和署名通讯作者的施引论文上也拿到了双料冠军,在该前沿表现了最强的潜在贡献度和潜在引领度。在美国表现最佳的28个前沿,中国也都有施引论文和署名通讯作者的施引论文贡献。具体而言,在近一半的前沿,中国贡献的施引论文和署名通讯作者的施引论文排名均在前10位,有的甚至在前5位,可见在这些前沿中国也表现了较强的潜在贡献度和潜在引领度。在其他前沿中国贡献的施引论文数均排在10名之后,中国的潜在贡献度和潜在引领度均表现一般。5 生物科学领域在生物科学领域,美国表现依然堪称惊艳,在所有25个前沿中均贡献了最多的施引论文,表现了最强的潜在贡献度。并在21个前沿美国贡献署名通讯作者的施引论文均排名第1,在这21个前沿表现了最强的潜在引领度。中国在施引论文的贡献相比核心论文的贡献明显增强。贡献的施引论文和署名通讯作者的施引论文均覆盖了所有28个热点前沿(详见附表1-V)。值得关注的是,在“使用伪氨基酸组分算法预测蛋白质的结构和功能”和“新型重组禽流感病毒(H5N8和H5N6)的鉴定及其特征”2个前沿中国贡献了最多的施引论文和署名通讯作者的施引论文,表现了最强的潜在贡献度和潜在引领度。在“褪黑素在植物和人类中的生物学功能”和“癌症化疗中纳米载体的应用”热点前沿,中国贡献的施引论文均排名第2。贡献的中国署名通讯作者的施引论文均排名第1,中国在这2个前沿表现了很强的潜在贡献度和最强的潜在引领度。中国在其他前沿的近1/3两项指标均排名在前3,也表现了较强的潜在贡献度和潜在引领度。6 化学与材料科学领域在化学与材料科学领域,中国表现突出,在24个前沿贡献了最多的施引论文和署名通讯作者的施引论文,表现了最强的潜在贡献度和潜在引领度,在其他8个前沿贡献的施引论文和署名通讯作者的施引论文也均排名前3,表现了较强的潜在贡献度和潜在引领度。美国则在6个前沿贡献了最多的施引论文和署名通讯作者的施引论文,表现了最强的潜在贡献度和潜在引领度,美国在19个前沿贡献的施引论文和署名通讯作者的施引论文排名前3,在这19个前沿也表现了较强的潜在贡献度和潜在引领度。在其他前沿美国的潜在贡献度和潜在引领度表现一般,甚至缺席个别前沿的施引论文和署名通讯作者的施引论文(详见附表1-VI)。中国不仅在两项指标的名次上完胜,而且从贡献的施引论文数量和署名通讯作者的施引论文数量和份额上中国都以较大优势,有的前沿甚至接近美国的10倍,从绝对施引论文数来看足以表明中国在化学与材料科学领域热点前沿的潜在贡献度和潜在引领度国际竞争中的绝对优势。总体来讲,在前沿贡献度和前沿引领度上,中国与美国在不同的新兴前沿各有侧重,中国稍胜一筹,而在潜在贡献度和潜在引领度方面,中国的优势则更加明显。7 物理领域在物理领域,中国和美国在物理科学领域所有20个前沿中均贡献了施引论文和署名通讯作者的施引论文。美国依然表现最佳,优势明显(详见附表1-VII)。具体而言,在“暗物质间接探测之银河系中心伽玛射线超出研究”、“外尔半金属的特性研究和实验实现”、“钇钡铜氧化物超导体的赝能隙态研”、“双星系统的动力学演化和引力波探测”、“基于希格斯耦合的标准模型研究”、“自驱动粒子的集群运动研究”、“非线性有质量引力”、“基于混合角θ13最新结果的中微子振荡研究”、“高级激光干涉引力波天文台及其相关工具和模拟方法”、“挠率牛顿-嘉当几何”、“周期驱动量子体系的特性研究”、“二硫化钼和二硒化钨的谷电子学研究”、“分数陈绝缘体的实验实现”和“自旋轨道耦合超冷原子体系”共14个前沿美国贡献的施引论文数和署名通讯作者的施引论文排名均占据了第1的位置,表现了最强的潜在贡献度和潜在引领度。进一步显示了其在物理科学领域的优势地位。其中“外尔半金属的特性研究和实验实现”、“二硫化钼和二硒化钨的谷电子学研究”、“自旋轨道耦合超冷原子体系”、“分数陈绝缘体的实验实现”、“暗物质间接探测之银河系中心伽玛射线超出研究”和“基于混合角θ13最新结果的中微子振荡研究”6个前沿中国贡献的施引论文分别排名第2、第2、第2、第3、第4和第5,署名通讯作者的施引论文均排名第2。可见,在这6个前沿中国也表现了较强的潜在贡献度和潜在引领度。值得关注的是,在“单层/多层黑磷的特性及其应用”和“超表面(metasurfaces)特性研究及超表面器件设计”2个热点前沿的施引论文方面中国表现堪称惊艳,中国以施引论文排名和署名通讯作者的施引论文排名两个第1,赢得了这2个热点前沿最强的潜在贡献度和潜在引领度。美国在这两个热点前沿贡献的施引论文排名和署名通讯作者的施引论文排名均为第2。表明在这2个前沿美国也表现了较强的潜在贡献度和潜在引领度。8 天文学和天体物理领域在天文学与天体物理领域,美国在天文学与天体物理领域的优势表现则更加明显。在所有12个前沿中,从施引论文数量和署名通讯作者的施引论文数量两项指标来看,美国都位列第1,在所有12个前沿表现了最强的潜在贡献度和潜在引领度。中国在施引论文贡献方面优于核心论文贡献,在12个前沿均有施引论文贡献,在11个前沿贡献了署名通讯作者的施引论文,但与美国之间依然存在较大差距(详见附表1-VIII)。具体而言,“基于太阳观测卫星数据(Solar-B、SDO、IRIS、STEREO等)对太阳大气和磁场的研究”、“中子星和核物质对称能研究”、“基于‘郭守敬望远镜’(LAMOST)、‘日内瓦-哥本哈根巡天’(GCS)、‘斯隆数字巡天’(SDSS)等观测对星系结构、成分和演化的研究”和“基于斯隆数字巡天等多项巡天项目的重子声学振荡相关研究”4个前沿,中国贡献的施引论文份额均在10%以上,个别前沿甚至达到20%以上,并且中国署名通讯作者的施引论文均排名第2。可见,这4个前沿中国表现了较强的潜在贡献度和潜在引领度。 9 数学、计算机科学和工程领域在数学、计算机科学和工程领域,中国在数学、计算机科学与工程领域的优势表现的更加明显。在所有13个前沿中,从施引论文数量和署名通讯作者的施引论文数量两项指标来看,中国取得了10个双料冠军,在这10个前沿表现了最强的潜在贡献度和潜在引领度。另外3个前沿中国贡献的施引论文排名均在前3,署名通讯作者的施引论文排名2个第1,1个第3,同样表现了较强的潜在贡献度和潜在引领度。美国在施引论文贡献方面优于核心论文贡献,在10个前沿均有施引论文和署名通讯作者的施引论文贡献,但与中国相比差距不小,中国优势明显(详见附表1-IX)。具体而言,在“几类偏微分方程的求解”和“基于临床应用的磁共振脑成像算法优化”2个前沿,中国贡献的施引论文份额均在50%以上,排名第2,其中中国署名通讯作者的施引论文均排名第1。在“城市热岛的缓解”前沿中国在两项指标上均排名第3,也表现了较强的潜在贡献度和潜在引领度。数学、计算机科学与工程领域中除此之外的其他10个前沿中国表现更加抢眼,在贡献的施引论文和署名通讯作者的施引论文方面均排名第1,以较大的优势表现了最强的潜在贡献度和潜在引领度。其中,美国在“构形设计和传热分析”、“关于Keller-Segel趋化方程的研究”、“面向企业的云制造及物联网信息服务”、“多输入多输出(MIMO)系统的研究与设计”、“测试设备无关的量子密钥分配研究”、“电动汽车用锂离子电池的充电状态估计和老化机制”、“应用纳米零价铁(ZVI)处理地下水和废水”、“基于临床应用的磁共振脑成像算法优化”和“混合动力电动客车的能量管理策略”9个前沿,也贡献了较多的施引论文和署名通讯作者的施引论文,两项指标均排名在前3位,也表现了较强的潜在贡献度和潜在引领度。10 经济学、心理学以及其他社会科学领域在经济学、心理学以及其他社会科学领域,美国依然是最大的赢家,在9个热点前沿贡献了最多的施引论文和署名通讯作者的施引论文,9个前沿中均表现了最强的潜在贡献度和潜在引领度(详见附表1-X)。另外在1个热点前沿施引论文和署名通讯作者的施引论文美国均排名第2,表现了较强的潜在贡献度和潜在引领度。中国在施引论文表现上明显优于在核心论文方面的表现,在所有10个热点前沿均贡献了施引论文和署名通讯作者的施引论文。在中国领跑的热点前沿“区域产业的环境效益和能源效率评价”在施引论文和署名通讯作者的施引论文排名上,中国同样以两个第1,在该前沿表现了最强的潜在贡献度和潜在引领度,这也是该领域中国在两项指标的表现上优于美国的唯一前沿。在美国表现最佳,施引论文和署名通讯作者的施引论文均排名第1的其他9个热点前沿,中国虽然也都有所贡献,但均排在3名以后,有的甚至排名在20名以后,可见中国在这9个热点前沿潜在贡献度和潜在引领度表现一般。通过中美两国在100个热点前沿和80个新兴前沿的潜在贡献度和潜在引领度指标的对比分析,结果发现中国在潜在贡献度和潜在引领度两个指标上的数据表现明显优于贡献度和引��度指标上的数据,而且这一特点普遍存在于上述10个主要的学科领域。另外,如果说从贡献度和引领度指标来看,中国与美国之间尚存在差距,那么从潜在贡献度和潜在引领度指标来看,这种差距明显的弱化了。正如数据所示,中国在10个主要的学科领域都表现了较强的潜在发展实力,这不仅预示了科研实力上中美之间差距有逐渐缩小的趋势,也坚定了中国科研工作者引领和主导更多热点前沿和新兴前沿的信心和可能,也让我们看到了中国科研工作的未来。讨论从10个领域内遴选的热点前沿和新兴前沿参与和表现情况的比较分析,较为全面地展现了中国与美国等科技强国的差距和优势。结果显示,在数学、计算机科学和工程和化学与材料科学2个领域,中国在贡献度、引领度、潜在贡献度和潜在引领度多个指标以及卓越前沿表现视角上均超过美国。表明在这些前沿中国已走在了世界前列,表现了最强的综合实力。希望通过中国科学家的进一步努力,加大中国的领先优势,并不断扩大中国在这2个领域优势前沿的覆盖范围。在农业、植物学和动物学领域、物理领域、生态与环境科学领域和生物科学领域,中国也都有若干前沿跻身世界先进行列。在这些领域,虽然从领域整体上中国的参与和表现情况略逊于中国在数学、计算机科学和工程和化学与材料科学领域的表现,与美国尚存在差距,但每个领域中也至少有1-2个前沿中国表现了最强的综合实力,而且在这些领域中国参与的前沿覆盖范围也较广。表明在这些领域中国处在不断成长和壮大的发展阶段。相信通过中国科学家的不懈努力,中国在这些领域会不断在更多的前沿有更好的贡献和表现,不断提升前沿的综合实力。但在地球科学、天文学和天体物理学领域中国领先的前沿数还较少。在这些领域中国缺少贡献度和引领度等多项指标都表现突出的前沿。从临床医学、天文学与天体物理学领域和经济学、心理学以及其他社会科学领域来看中国参与和有所表现的前沿覆盖范围较小。这些前沿从整体表现上来看,中国与美国差距较大。表明在这些领域需要中国科学家付出更多的努力,不断缩小差距,逐步扩大中国在这些领域的参与范围,增强中国在这些领域前沿的贡献度、前沿引领度、潜在贡献度、潜在引领度和卓越前沿表现。 参考文献:[1]《2016研究前沿》. ttp://www.casisd.ac.cn/achievement/research-report/achievement-detail.html?id=ecfda155-bda0-4775-8e54-dde418e4b44c.附表1 10个研究领域前沿的施引论文中美国和中国的潜在贡献度和潜在引领度序号前沿名称贡献国家总论文中国贡献美国贡献中国通讯作者美国通讯作者论文比例排名论文比例排名论文排名论文排名I农业、植物学和动物学领域1食品检测中的高光谱成像技术5162226342.338.5B2412952光合作用捕光蛋白复合物的结构与功能53103613613.119919.2!14313923子囊菌和半知菌的分类学与系统发育学88120338832.35621.3304114424生鲜食品微生物污染的爆发与防控71956666.9C7539.29532315植物先天免疫机制3849310621.5!6934.35213116抗氧化肽的分离与表征5859124541.557.623011877细菌VI型分泌系统的结构与调控53788759.5S1740.23425318营养物质纳米乳递送系统66135319214.2#7527.749229819田间高通量作物根系表型分析77101614113.9B9328.8113230110蝙蝠白鼻综合症5446171.530967.0162671II生态与环境科学领域1海洋环境中的塑料微粒污染76771324.221127.48815612福岛核事故对环境的影响59776587.5A3717.7#348923生态系统服务11421721727.9w1733.041548914两栖类动物的传染性疾病:壶菌病的生态学研究1021233373.070357.05854915生物多样性丧失和生态系统的变化10413461027.653139.56734016溴系阻燃剂对环境的影响及其替代者有机磷阻燃剂72160441625.9%0831.777240917全球性汞污染83147826117.7&6244.819252218β多样性871061777.3"7135.06824719生态物种形成的遗传学和基因组学研究11828881796.230745.3247980110土壤重金属污染89187288147.1085.8840139811系统性的杀虫剂(烟碱和氟虫腈)对非目标生物及环境的影响276334.81523.8710112水结构和chaotropicity、kosmotropicity:使用、滥用及其生物学意义296423.11929.7!1292III地球科学领域1北极放大效应与中纬度极端天气的关系78118512910.9U7348.403243312土壤碳循环对气候变化的响应98194037419.3100351.767269313全球变暖趋缓(hiatus现象)96269228010.4Q40852.3064100314地球早期海洋的演化以及与之相关的生物进化79340538011.2A60947.3444118815气候系统模式研究69200329314.6A12055.989383016高亚洲冰川质量变化研究89153845629.6%0733.065129227下一代地震动衰减地面运动预测模型研究61934485.1s9242.097314182011年东日本大地震同震滑动研究60984939.537037.6&1326129内陆水域和海洋的碳循环67124914011.2e5444.473391110末次间冰期气候变化研究5910561039.8u1548.8653231112012年夏洛特皇后群岛地震断层带研究124112.4r663.4%1//24112北大西洋和南大洋的元素组成3012775.5‡760.67481IV临床医学领域1索非布韦与西咪匹韦用于不同基因型丙型肝炎治疗临床试验671333413.164548.491053112埃博拉病毒病流行与治疗8615151036.8X6357.06371813麦胶肠病及非麦胶肠病性麦胶敏感681288141.1#36328.22527814东南亚恶性疟疾青蒿素抗药机制1021561805.161539.481138815循环肿瘤DNA用于肿瘤获得性耐药监测5111811129.5T9441.81438416抗PD-1药用于黑色素瘤治疗6550442364.7'78255.2688245817PCSK9单克隆抗体对高胆固醇血症患者LDL胆固醇影响591068464.351247.98842318禽流感病毒的流行病学、病理学和遗传学研究87182472139.51038.9&46148929单克隆抗体治疗自体免疫性疾病的临床疗效研究521016838.2D4243.594332110全基因组测序在传染性疾病的快速诊断和生物进化中的作用1061507805.3u7338.085430111程序性死亡1(PD-1)抑制剂对晚期非小细胞肺癌的治疗作用301161210.35749.10247112心肺复苏临床研究中的几个热点问题3521631.48338.41365113儿童急性弛缓性脊髓炎与肠道病毒D68爆发相关206945.8c144.9627114sofosbuvir联合其他药物防治肝移植术后复发性丙型肝炎1810643.8e350.0547115乳腺癌术后区域淋巴结照射治疗的效果271031211.7#836.91234116心房颤动患者脑卒中风险和抗凝治疗197134.2723.9!1112217长链非编码RNA MALA T1促进癌细胞的增殖和转移181058278.1514.3(019218绝经前乳腺癌卵巢抑制的辅助药物3410821.94743.51039119端粒基因突变与家族性肺部疾病339377.5d750.5438120埃博拉病毒病的传播与控制388244.9t554.9432121口服抗凝药的消化道出血风险3719842.06733.8195912213价肺炎球菌疫苗(PCV13)防治侵袭性肺炎链球菌病4015431.97347.41556123LCZ696与依那普利对心衰患者影响比较5320641.98943.22072124抗白细胞介素-5受体α单克隆抗体治疗嗜酸性哮喘2811343.54842.5842125乳腺癌家族史中BRCA1/2、PALB2基因突变与乳腺癌风险评估3013575.2w656.3562126降低血糖的药物对心血管结果的影响2710243.9"443.1733127GBCA增强造影术后颅内钆沉积319844.13434.7925128Sorafenib和lenvatinib治疗难治性甲状腺癌2510776.5t138.3536129皮质激素辅助治疗社区获得性肺炎2710287.84039.2333130卡铂新辅助化疗治疗三阴性乳腺癌2683910.8S542.2425131配对活检揭示非酒精性脂肪肝疾病进展267745.2S039.05261V生物科学领域1中东呼吸综合征冠状病毒的分离、鉴定与传播7799119820.0$1441.842228012褪黑素在植物和人类中的生物学功能58100517817.7"7727.668110433飞秒X射线激光在生物大分子的纳米晶体结构测定中的应用44905576.3,,2046.43529614巨噬细胞起源、发��分化的分子机制551709754.4˜0046.82867315阿尔茨海默病相关基因位点的关联分析65199220510.3102151.368379716RNA二级结构及腺嘌呤甲基化修饰70209423411.298947.289380617广谱中和抗体与艾滋病疫苗设计681696975.7a21671.793102118PINK1/ Parkin介导的线粒体自噬分子机理研究5720761637.9Y1043.824578119T 细胞的分化、功能与代谢59246825010.1!41157.27821226110C9orf72基因六核苷酸重复扩增引起的额颞叶痴呆症和肌萎缩侧索硬化症541508553.664542.8310504111CRISPR RNA引导性核酸酶脱靶效应的全基因组检测19771114.3$761.0243112植物提取物和纳米粒子控制蚊虫害1123626.1V26.1Q2//13肥胖的全基因组关联研究501011110.9u453.5737114雷帕霉素靶蛋白复合体1(mTORC1)的激活18581017.2#662.1231115纳米孔测序509455.3d750.0840116树枝状大分子纳米载体用于肿瘤靶向给药和基因转移29951515.83233.74318217使用伪氨基酸组分算法预测蛋白质的结构和功能19775166.2431.2%014218利用人类表型本体数据进行遗传疾病诊断4112086.7-755.85491192型先天淋巴样细胞调节米色脂肪的生物合成28133139.8'556.4367120癌症化疗中纳米载体的应用331011918.8"322.89117221CRISPR-Cas9调控的基因组规模转录激活221302216.9)270.84285122自噬与凋亡的互作411584226.6$327.27130223染色质环接原理及染色体域结构进化2913396.8g858.61466124肌动蛋白的组装及其网络平衡2110543.8U855.2551125荧光探针在细胞骨架活细胞成像中的应用2410787.5D138.3334126新型重组禽流感病毒(H5N8和H5N6)的鉴定及其特征18592033.9830.5!9113227遗传结构和饮食对肠道菌群组成的影响269933.0...858.61050128耳蜗毛细胞的再生及其基因表达21831113.3%465.12501VI化学与材料科学领域1基于非富勒烯受体的聚合物太阳能电池4057924241.83222.8"1718922三氟甲硫基化反应4185742349.42214.2$1019223摩擦纳米发电机4178538549.05945.7"59123124非贵金属电解水纳米催化剂4064538760.07026.4#47112425金催化的有机合成4293329531.66317.5"80113426高效钙钛矿型太阳能电池68272691733.66720.8(05141627半导体/石墨烯纳米复合物光催化剂57148197866.0268.5)2517548白光LED用荧光粉572657164161.8726.5153519569石墨烯过滤膜62186563133.84229.1%361402210钠离子电池40109145541.74922.8#971194211具有大载流子扩散长度的有机铅卤化物钙钛矿单晶261724928.5&236.02244112有机铅卤化物钙钛矿材料在潮湿环境下的分解27891820.2"427.07117113钙钛矿型纳米发光材料22651624.6!827.73215114碳量子点荧光材料20876271.36.9&014215具有电磁波吸收性能的核壳结构材料8999393.9//931//16邻亚甲基苯醌的不对称有机催化反应16984444.9212.243112317钙钛矿型有机铅卤化物光电探测器18772431.2"836.41222118镍催化芳基醚碳氧键活化反应15691927.5&8.7A725419光活化的不对称催化反应19903437.8820.026118220镧系金属有机框架化合物用于荧光温度传感261278566.929.4(219221非水体系锂氧电池中过氧化锂的生成机理22751621.32736.02223122高效单结聚合物太阳能电池2842924456.9219.1"20146223钙钛矿型太阳能电池光电转换机理研究393357823.3!0130.13274124二维过渡金属硫族化合物纳米材料2223115265.8916.9!29123325纳米二氧化锰超级电容器电极材料231018281.26.9(21//26钠离子电池231818245.3625.4&3134227基于柱芳烃的超分子聚合物8898191.0011.2'913228过渡金属催化的杂芳烃交叉偶联反应321091412.876.4a236529用于染料敏化太阳能电池的新型卟啉染料27903033.37.8B914430纳米颗粒的细胞生物学效应23893236.0820.22617331三价铑催化的芳烃碳氢键活化反应11694463.8014.5$314332高性能锂硫电池12713447.9245.1"91282VII物理领域1暗物质间接探测之银河系中心伽玛射线超出研究634225011.8B3054.53217512单层/多层黑磷的特性及其应用4164928343.63836.7"38117223外尔半金属的特性研究和实验实现4382520124.4#9147.450227314钇钡铜氧化物超导体的赝能隙态研究48650578.8s6556.25428515双星系统的动力学演化和引力波探测4613211168.8--6758.19750516基于希格斯耦合的标准模型研究67724709.7,5334.95616717自驱动粒子的集群运动研究46945859.0S2334.29622518非线性有质量引力46674405.919328.62513219超表面(metasurfaces)特性研究及超表面器件设计45102742040.95634.7#621279210基于混合角θ13最新结果的中微子振荡研究67151920913.8S7524.7662209111高级激光干涉引力波天文台及其相关工具和模拟方法288589.4...261.21226112挠率牛顿-嘉当几何204436.82147.7%1//16113周期驱动量子体系的特性研究215811.72339.71019114二硫化钼和二硒化钨的谷电子学研究412557328.6!2649.42288115AdS(5)xS(5)超弦的可积性研究256611.5812.1a143616基于2013年普朗克卫星数据的宇宙暴胀模型研究3313175.32216.86813317超导体硒化铁的向列性研究22671623.9B638.81313218新软引力子定理研究249588.4c132.6819219分数陈绝缘体的实验实现351583220.35836.76239120自旋轨道耦合超冷原子体系271013130.7$140.662271VIII天文学与天体物理领域1基于“普朗克”卫星(Planck)等对宇宙微波背景辐射的探测5619041367.199652.30653312暗物质和星系形成及演化研究561638835.187453.401153913基于“开普勒空间望远镜”(Kepler)开展系外行星搜寻及性质研究541720834.8113165.82678614利用“哈勃”空间望远镜研究高红移值星系的性质521338795.994370.54952515系外行星的形成、演化和直接成像研究551294524.088868.631256216基于太阳观测卫星数据(Solar-B、SDO、IRIS、STEREO等)对太阳大气和磁场的研究60287542614.8151552.733295917超新星及其对应前身星性质研究6414921036.999666.84760718中子星和核物质对称能研究66195043822.5'0736.361242219基于“郭守敬望远镜”(LAMOST)、“日内瓦-哥本哈根巡天”(GCS)、“斯隆数字巡天”(SDSS)等观测对星系结构、成分和演化的研究59164824014.6i0354.8712509110基于斯隆数字巡天等多项巡天项目的重子声学振荡相关研究59184935119.062133.6772346111罗塞塔(Rosetta)探测器对彗星67P/丘留莫夫-格拉西缅科的观测研究3011354.48272.6%1//28112恒星、星系形成理论与观测研究359388.67378.59361IX数学、计算机科学与工程领域1犹豫模糊集理论及其在决策中的应用3344535279.122.7S421482构形设计和传热分析4643925357.6412.3"4113323关于Keller-Segel趋化方程的研究3639614336.1621.7!2315924几类偏微分方程的求解4034510029.0$212.28612645面向企业的云制造及物联网信息服务5250929858.50339.9"5017426多输入多输出 (MIMO) 系统的研究与设计5158122839.22421.3!9217027测试设备无关的量子密钥分配研究58105829427.84814.027118638电动汽车用锂离子电池的充电状态估计和老化机制5183030436.61325.7"75114929应用纳米零价铁 (ZVI) 处理地下水和废水6480934742.9912.2#03146310生物启发式算法及其优化6290524026.5110.1B14149511基于临床应用的磁共振脑成像算法优化15472655.3"859.6618212混合动力电动客车的能量管理策略26934548.4617.2$018213城市热岛的缓解176557.769.2$324X经济学、心理学以及其他社会科学领域1电子烟的用户偏好、有毒物质释放、管制以及对戒烟的影响47823101.248659.11544412亚马逊土耳其机器人与合作行为研究491934753.9a44474.726126513美国卫生保健改革的影响与成效4292480.9^0687.2779114全球水烟的发展及其对健康的影响5041651.2#25060.12121215网络成瘾的致因与行为影响56121612110.0D5937.706334016自残与自杀行为研究551106191.764958.77856517家族控制(参与)对企业战略选择和创新的影响42489418.4r2145.26814318音乐训练与认知能力43872374.2"5040.11828519全球土地和自然资源争夺研究80663253.820731.2312150110区域产业的环境效益和能源效率评价5867630344.8914.6"741702注���每个领域共遴选出10个前沿,序号1-10的为热点前沿,其余为新兴前沿。 “战略与政策论坛”聚焦创新发展战略与政策,推送分享“战略与政策”相关研究成果和动态信息,交流探讨国家创新战略与政策研究! 您可以点击右上角,分享给朋友,也可以添加公众号“StrategyPolicyForum”关注,或长按、扫描识别上方二维码加以关注。 谢谢您的关注和支持!欢迎赐稿:Email:strategy_policy@163.com!国家最高科技智库呼之欲出中美科研实力比较研究:基于《2016研究前沿》的分析2016研究前沿发布暨研讨会邀请函2016研究前沿发布暨研讨会在中科院举行《2016研究前沿》受到英国权威科学期刊关注白春礼:分类施策改革科技评价制度白春礼院长谈中科院“十三五”发展规划《中科院“十三五”发展规划纲要》在京发布《中国科学院“十三五”发展规划纲要》(全文)及问答白春礼:深化科技体制机制改革 实施创新驱动发展战略白春礼:按“三个牢牢把握”塑造引领型发展白春礼:创造未来的科技发展新趋势白春礼:担负起作为战略科技力量的历史使命习近平总书记在全国创新大会上的讲话(全文)中国科学院院长白春礼谈习近平总书记重要讲话白春礼赴青岛进行工作调研白春礼:科学精神 百年弘扬白春礼:按“三个牢牢把握”塑造引领型发展白春礼辽宁纵论创新、合作与改革科技成果转化是高风险的创新活动国务院办公厅关于印发促进科技成果转移转化行动方案的通知国务院五大举措促转化:“幸福来得太突然”影响制约科技成果转化和知识产权运用的问题分析与对策研究上海交通大学一年内可能造就十几个千万“科技富翁”科技成果转化需要多维度评价科技成果转化助力供给侧改革韩国制定促进基础与原创研究成果转移转化方案“互联网+科技大市场”——论构建科技成果转化新机制美国科学院发布小企业技术转移计划评估报告美国NIST对商务部提出进一步推动技术转移的改革建议美国“国家微生物组计划”解读【科技书廊】《知识、技术和社会的会聚:超越纳米、生物、信息和认识技术的会聚》十五部门印发《国家科技计划(专项、基金等)严重失信行为记录暂行规定》日本科技振兴机构提出改革国立大学科研经费的10条建议美国发布“纳米技术引发的重大挑战:未来计算”白皮书提升科技创新资源配置的综合化与专业化水平美国OSTP发布《2016年国家战略计算计划战略规划》科学报国 实现梦想-在"百人计划"入选者国情院情研讨班上的讲话演讲稿 | 政策与科技的力量:执行主任在东京国务院印发《"十三五"国家科技创新规划》(全文)聚焦“十三五”国家科技创新规划五大看点工信部印发《促进中小企业发展规划(2016-2020年)》习近平与创新驱动发展战略国民经济和社会发展第十三个五年规划纲要习近平总书记对十三五规划的战略布局习总讲话透露“十三五”哪些重大改变习近平谋划“十三五”的足迹习近平关于《中共中央关于制定国民经济和社会发展 第十三个五年规划的建议》的说明李克强谈十三五纲要编制“十三五”规划思路的十大转变杨伟民谈“十三五”规划建议与国企改革制造强国 创新先行国务院印发《“十三五”国家知识产权保护和运用规划》“十三五”国家信息化规划“十三五”国家战略性新兴产业发展规划战略性新兴产业发展特征与工作思路《国家自然科学基金“十三五”发展规划》杨卫:我国已到达世界科学中心的边缘互联网思维、企业家精神与经济转型中办国办印发《关于促进移动互联网健康有序发展的意见》感恩2016,祝福2017迎春祝福,新春再见丁酉鸡年,新春大吉!【元宵诗词赏析】祝大家元宵快乐!首届中国特色镇智库圆桌会议在北京举行国务院印发《国家教育事业发展“十三五”规划》国务院印发《关于鼓励社会力量兴办教育促进民办教育健康发展的若干意见》《国家人口发展规划(2016—2030年)》潘教峰:科技智库研究的DIIS理论方法穆荣平:科技强国能力建设的政策思考习近平主席在联合国日内瓦总部的演讲(中英文)习近平主席在世界经济论坛2017年年会开幕式上的主旨演讲(全文)美国第45任总统唐纳德·特朗普就职演说(中英文+视频)布鲁金斯学会为特朗普政府提出50项创新政策建议创新区的崛起:美国创新的新地理美国高端产业:定义、布局及重要性丁仲礼:气候变化及其背后的利益博弈丁仲礼:应对雾霾,源头减排是关键习近平主席2017年新年贺词提及中科院多项成果中科院副院长张涛调研战略咨询院中科院战略咨询院召开2017年度职工大会中科院科研合作位列全球科研机构第四十八大以来习近平总书记对人才工作的重要论述坚定改革信心注重精准施策 提高改革效应放大制度优势白春礼:加速科技成果转化 推动科技供给侧改革智库建设在总书记心中有多重要?习近平:党政主要负责同志是抓改革的关键@热点关注【万劲波】完善国家科技创新决策咨询制度中科院学部:科技领航六十年白春礼:国家使命 智库担当美国《2016-2045年新兴科技趋势》报告2016年度科学技术突破和2017年展望'

scanny commented 7 years ago

See if there are any vertical tab characters ('\v') in the text and replace them with a space or line feed ('\n'). Also, in future, please make your pasted examples short. It's your responsibility as the one asking for help to reduce the code you send to the minimum it takes to reproduce. Also you didn't include any description or actually ask a question. Please do your part.

frenet commented 7 years ago

Sorry for my ignorance, I do not know the reason why python-docx fails to write these Chinese content into a document, So I put all of them on the box here. The Chinese content is crawled from a website.

scanny commented 7 years ago

Well, I would start by narrowing it down with a binary division approach. Cut the text in about half and try both halves. If one shows the failure, cut that in half, etc., down until you have a convenient size. In five iterations you can have text that's 1/32 the size. When it gets small enough, loop through the individual characters with chr() (to display the character number) and identify the offending character. It's probably a control character such as a vertical tab, escape, bell, or other low-ASCII value. Filter that out and it should all work.

stone-stones commented 6 years ago

@frenet Do it like this: text = u"中文"