CoinCheung / gdGPT

Train llm (bloom, llama, baichuan2-7b, chatglm3-6b) with deepspeed pipeline mode. Faster than zero/zero++/fsdp.
Apache License 2.0
90 stars 8 forks source link

看了您的碎碎念 #17

Closed mc112611 closed 11 months ago

mc112611 commented 11 months ago

很对,确实国内程序员行业确实鱼龙混杂,开源,实际上从不同的角度去看这个问题,细节还是很多的。 但是究其原因,终究是利益的问题。我也很喜欢开源精神,在俺看来,人类的发展进步,离不开开源。只有分享了自己已知的知识,后来人才能在已有知识的基础上,再进行添砖加瓦。

有一点不得不承认,国外的程序员水平确实比国内高,确实要承认,人家确实发展计算机比国内早了好几十年。并且很多项目,研究其整体结构的时候,我都觉得设计基础类的架构师,简直是天才。

但是,也有一点需要承认,国外是技术导向,国内是资本导向。 如果从现在人工智能领域来反推前几年的云计算大数据爆火。 那个时候实际上云计算,大数据技术,由国外大公司开源出技术,本希望国内可以利用技术,好好收集数据,为日后的人工智能技术积累数据。 然而,大数据云计算变成了捞钱的,并没有想到,收集数据实际上是为了以后的人工智能。 我在工作中,遇到过很多数据,甚至字段设计,该有的数据库设计,比如一条数据的时间,来源,关键信息,数据的类别。 这些工作甚至都没有做。

就像您说过的,都是要吃饭的,这个确实。在活着这件事上,本身就没有对错之分。 只是对于喜欢技术的人来说,不是那么浪漫,不是那么让自己热血沸腾,把全部的快乐放在解决问题的那一个瞬间。

回到国内技术开源这个这个话题。 我个人将haystack这个框架优化了支持中文。 但是一直没敢往github或者知乎CSDN上放。 我也考虑了很多这个问题。 从整体考虑, 这是为整个国内行业做贡献。 但是,我如果放出来了,最先获利的也许还是那群玩资金,玩钱的有钱人们。 并且,从我自身考虑,这个技术放出来,我能突破现在20K的工资吗,开源了这个技术,顶多收到一些赞叹, 但是繁华散去,我依旧是那个北漂的打工人。 曾经我希望所有技术都开源,但是最后,我发现,我成了那个不愿意开源的人。

无任何不良导向,只是诉说自己看法,求同存异,支持反驳。

看了作者的话,有感而生。