pigbreeder / CodeMemo

1 stars 0 forks source link

notes 备份 #14

Open testpppppp opened 1 year ago

testpppppp commented 1 year ago

项目部署,线上服务

https://www.eula.club/blogs/%E4%BD%BF%E7%94%A8Flask%E5%B0%81%E8%A3%85%E9%9B%86%E6%88%90%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0%E7%AE%97%E6%B3%95.html#_6-5-%E4%BD%BF%E7%94%A8python%E8%A3%85%E9%A5%B0%E5%99%A8

样本筛选

https://zhuanlan.zhihu.com/p/394985481 得到每个类目预测的概率均值,去除大于均值但预测类目不一致的样本。 按照概率高到低排序去除一部分。

去除一直学不会的,CNT 去除loss最大的, 去除概率最平的PMI 去除大于预测概率均值的 去除two-cross预测不对的

testpppppp commented 1 year ago

候选图书

https://book.douban.com/subject/30047160/ 洞察:精确观察和有效沟通的艺术

https://book.douban.com/subject/35932412/ 苏珊·麦克弗森在《连接的方法》

testpppppp commented 1 year ago

个人定位

个人定位

p7工作1.2,写文章/拍博主3,企业扩展/人脉售货6

什么是关键核心? 业务是什么,客户痛点是什么,客户是谁,怎么做后续?

技术什么是核心? 问题,元素,流程,概念,指标(业界水平/合理区间)overview 框架

对待细节

细节学习实操通过请教视频网站请人(不被忽悠)来做

工作

向上沟通;Leader的话当回事,反馈积极 工作复盘;工作内容复盘,每天完成,未完成,分析,对照安排第二天 沟通表达;指标是0,结论是123,原因是456,后续是789

真实世界方案更多考虑灵活/普适/可变通/性

冷启动就是规则,混排MMR或其他打扰策略

Top2位置只按照ctr排,原因是用户有曝光但是不会惦记或者下滑,top2位置起到一个引导作用,用下滑率调

企业

元素:新闻/评论/品牌/

文本匹配/文本聚类, 更灵活,可配置,效率高 文本分段,ocr信息

用户流失模型(兰陵王打野还行)

视频

自媒体视频有哪些?

我看哪些 美国新闻,坡县新闻

摁住侃一侃 自个侃

有趣在哪 不着边际的话,打破预期 美食探店 想法侃一侃 口语扩展,大差不差 生活习惯

特点 同一个事情,不同的版本,拍摄多次

一般人的看法,专业人的看法,我的看法。发在日本出发前

testpppppp commented 1 year ago

赵立坚的路径依赖,错误榜样效仿

把握整体,把握框架再填充细节。朝代歌,地球太阳之间的关系;蜘蛛结网和已有做关联。 艾宾浩斯遗忘曲线,1小时44%,1天33%,3 5 10

https://cocozq.com/?p=545 搭建Wordpress网站

学习并理解概念 b roll 升格 变速

https://www.youtube.com/watch?v=EiIASqo018o&ab_channel=CruisingCat%E9%A3%8E%E5%85%89%E5%96%B5 #拍视频 https://found.eula.club/2023/2023.01-03--%E7%AC%AC11%E6%9C%9F.html eula.club/blogs/文字描述生成绘画及旧照片着色算法.html https://www.eula.club/blogs/Telegram%E5%8F%8ATelegram-bot%E4%BD%BF%E7%94%A8%E6%8C%87%E5%8D%97.html#_2-7-telegram%E8%AF%AD%E9%9F%B3%E8%BD%AC%E6%96%87%E5%AD%97 https://github.com/TurboWay/spiderman https://github.com/ruanyf/weekly/blob/master/docs/issue-211.md

testpppppp commented 1 year ago

品牌抽取

testpppppp commented 1 year ago

从数据中发现需求,发现问题的能力

policy方案

托里霍斯将军说过,就像锯木头有时向前有时向后,但总体是向深度发展的。

年轻应该接触简单的社会 有一个点是很多人没考虑到的,那就是高干子弟的孩子其实在中小学期间接触的环境可能简单点就是学习偶尔加点运动和兴趣班,而工农子弟的孩子接触的那可是五花八门,那真的是吃喝嫖赌抽样样俱全。穷人的孩子早当家其实是指他接触到社会的方方面面更早,而孩子是没办法知道这些所谓的灯红酒绿其实只是社会中很小的一部分,真正的好东西他的父母也不知道,也不会交,连描述都描述不出来。那么他们就很快的被这些低层次的灯红酒绿给腐蚀掉。高干的子女在读书的时候,工农子弟在纸牌,蹦迪。

万能钥匙 云图2012

胡新宇 https://www.youtube.com/watch?v=tVMvynXYZ4Q https://www.youtube.com/watch?v=_Rlrhr4yAz8 信息噪音的理解 https://www.youtube.com/watch?v=K3SD8LiB7uI 当一个系统放大到社会这么大,很难辨别出噪音和真实信息,少部分人掌握了信息的源头和传播通路,操纵大众意见并不复杂,针掉进杯子里和掉进游泳池;开车100km/h和地球自转感知很难,周边一切都自带系统速度;狭小的人类智慧感知到足够强足够多的信号,美国通胀为例是半年。 社会是个共同体概念,结成集体力量大,当社会不再承担共同责任时候,信任共同体就会解体

手头资产抵押买更大的资产,所有开销都算是债务内支出,不需要交税,此时仅需要让自己净资产增加速度超过债务成本增加速度,人际关系和分散配置可以做到(公司盈利记账实体都做成债务)

Fiddler抓取手机APP包 手机上可以试试http catcher或者thor https://cloud.tencent.com/developer/article/1560286 https://juejin.cn/post/6972740110274002975

什么样的工作是随着时间价值增长?

什么样的工作是增量市场?存量市场很难做 抓住利基市场机遇:9个具备待开发潜力的利基市场例子 https://www.shopify.com/zh/blog/niche-markets

政府已承诺铲除腐败。 The government has pledged itself to root out corruption.

每天花半小时看创意网站 怎么记录/怎么知识抽象? https://zhuanlan.zhihu.com/p/360770687 https://creativemass.cn/#/daily-recommend www.abduzeedo.com www.pexels.com https://www.skypixel.com/ nowness.cn/ https://pixso.cn/designskills/10-creative-websites/

促发效应 某个刺激引发后面的行为。先是引导性问题,再接上真是要问的

一致性倾向

testpppppp commented 1 year ago

武汉医保 什么事情 是不是合理(过程中的合理性和公平性) 为什么群众运动风起云涌? 原子化的社会。。。。。。。。 经济放缓 社会缓冲机制,没有安全带

中国国家结构/地方行政制度/中央与地方关系的历史沿革与经验教训、中共治下中国各地域的概况(王庆民) 塔西陀陷阱(知乎回答)

复杂机制与轮回

目中无人 万能钥匙 云图2012

topic 好主题

我们的教育让人太谋求长远了

资本主义,核心是要有贫富分化原始积累,让原始积累能够增值 信用的使用,未来的钱盖现在的面包店

加减乘除能寓教于乐,三角函数,微积分复变函数怎么寓教于乐? 关注一线反馈,永远是个吃力不讨好,低ROI又需要长久坚持的事 工作中的考量因素,话语权也是非常重要一点

信息噪音的理解?

避免成为算法定义人类?

寻找秘密的方法是: 去怀疑那些常人从来不怀疑的地方。而找到一个秘密之后,既不要谁也不告诉,也不要告诉任何人。开一个公司,将这个秘密变成一个创意,和公司内部的人分享这个秘密,才是合适的方法。有什么问题? 从数据中发现需求,发现问题的能力

新兴人群,新兴概念,新兴app,新兴游戏/明星 勇敢/冒险精神/计划预期

testpppppp commented 1 year ago

扩展写作

为什么不这样(替换方案比较) 反着想(国外游行-不安全;什么情况下我能这样做) 被忽视群体的视角(生产/购买者角度)

面试

代码能力 讲一件复杂的事(表达能力),如何优化的(处理问题) 给一个开放场景,如何分析/拆分落地 如何检测出来强迫症?(有利的执行类) 别面试时如何考察应聘者的性格特点? - 小红拖拉机的回答 - 知乎,字典中抽取出来的5大性感类别 https://www.zhihu.com/question/22521327/answer/130479890

testpppppp commented 1 year ago

技术视角看问题,但更多的是需求视角看问题。我能做什么而不是我会做什么 利基市场,差异化才能垄断

一些概念结合市场

环保意识消费者 健康与保健 宠物主 LGBTQ+ 群体 旅行者 游戏玩家 房主 远程工作者 当地人

testpppppp commented 1 year ago

商品产品力量

商品质量

商品价格

商品趋势

商品口碑

testpppppp commented 1 year ago

压制舆论废掉了社会民众对政策最直接的反馈路径,就好象一个人把自己痛觉神经切了然后妄想靠机械监视来维持正常生理活动一样。

这种无痛症畸形当然可以在某些集中力量办大事不惜一切代价时表现出惊人的执行力行动力,但大脑无法准确掌握肉体状态的后果就是全身没有一个细胞可以真正判断代价,随时都可能上一秒还生龙活虎下一秒就过负荷栽倒崩溃。

testpppppp commented 1 year ago

tech

无监督分词YAKE

https://zhuanlan.zhihu.com/p/161668038 https://blog.csdn.net/qq_45041871/article/details/126759704 https://zhuanlan.zhihu.com/p/377737998

数据增强

骨干信息还原,小范围可控文本生成 https://zhuanlan.zhihu.com/p/63894745 # 一些提示 https://zhuanlan.zhihu.com/p/585861271 # 骨干信息还原 https://zhuanlan.zhihu.com/p/146777068 # 通用方案

电话助手调研 https://zhuanlan.zhihu.com/p/161640191

常见问题

其中 苹果翻译成 apple,是一个示范样例,用于让模型感知该输出什么。只给提示叫做 zero-shot,给一个范例叫做 one-shot,给多个范例叫做 few-shot。再多的话,就成了传统的finetune 模式了。

LSH之间的关系

minhash和simhash用的不同度量方案 https://octopuscoder.github.io/2019/05/15/%E6%96%87%E6%9C%AC%E6%9F%A5%E9%87%8D-SimHash%E5%92%8CMinHash%E7%AE%97%E6%B3%95/ https://www.cnblogs.com/sddai/p/10088007.html https://github.com/Jmkernes/Locality-sensitive-hashing-tutorial/blob/main/LocalitySensitiveHashing.ipynb 局部查找

面试文档 https://wizardforcel.gitbooks.io/the-art-of-programming-by-july/content/index.html

testpppppp commented 1 year ago

数据增强,对比学习和对抗学习结合 https://zhuanlan.zhihu.com/p/449428527

testpppppp commented 1 year ago

不会觉得有什么用。回顾三年疫情,你就能看出中美两个国家对付灾难的能力和效率了。 首先,西方政要从开始就准确地预见了与病毒共存的结局。并且从开始到结束,目的都很明确,就是不要让医疗系统奔溃。在疫苗开发出来之前,也采取了限制民众外出的措施。虽然,每天都发出警告说医疗系统承受很大的压力,可是也没有崩溃。甚至没有出现成规模地要私家车运送遗体的地步。光这一点就比盐碱地强很多。其领导能力是建立在科学判断和历史经验的基础上的,而不是拍脑袋瞎猜。看看盐碱地,完全就是不惜代价地瞎搞。 其次,商业机构的活力非常强。一方面,用技术手段筛查可能有效的药物。大型的制药企业积极开发疫苗,德国的成果很快就被转化为疫苗。尽管也有羟绿奎那样的假方案出现,但很快就被淘汰出局了。他们的商业机构,从研发到生产过程速度都很快。不长时间,多种有效疫苗都出现了。疗效,可能的副作用的数据收集非常及时,而且都是准确的。反观盐碱地,尽管也号称开发出疫苗了,疗效数据没有,中医骗子大行其道。作为社会的重要组成部分,机构的效率和活力,中国完败。 第三,西方民众体现了理性和宽容。没有出现互相设置路障,歧视受感染者的情况。也没有出现大规模的不服从政府管控的情况,社会层面上的摩擦很小。而盐碱地封城、封村的笑话多的不胜枚举。 很多盐碱地人以为西方民众怕死。事实上,西方民众表现出来的乐观和爱好自由的精神,很大程度上也帮助他们客服了对死亡的恐惧。而盐碱地人民,真的很怕死。一群就想活着的人,你怎么指望他们勇敢地去保卫他人的利益呢? 再多的军费开支又能怎样呢?养更多的陈薇那样的英雄吗?还是钟南山那样的骗子?一个由裙带关系构建的评估体系,生产一些不着边际的垃圾武器?防弹背心里面装炸自杀用的炸药。这就是他们的研究成果。这和那些中医抗疫由有什么不同吗? 世界上很难看到一个国家周围全是敌人。邓小平攻击越南之前,还知道外交先行,尽量减少敌人。难道要和全世界打吗?

testpppppp commented 1 year ago

https://welts.xyz/2022/06/23/anomaly_dec/ # 异常检测的类别和方法

testpppppp commented 1 year ago

一个部门,信息公开。

卖家分层 + 动销商品

错放率来指导快速构建

testpppppp commented 1 year ago

cv知识点

CLIP MOVO VIT DPP diffusion BLIP

爬虫

https://www.bilibili.com/video/BV1F94y1Z7hm?p=31&vd_source=cef70ac1890c165cee70e22179a17ef9 https://www.bilibili.com/video/BV1j34y1J7u6/?p=3&vd_source=cef70ac1890c165cee70e22179a17ef9 could爬取 app爬取

business 农产品转销

testpppppp commented 1 year ago

category BPO偷懒情况;大类目不同,但是叶子结点很像(women和小孩的hat&cap)处理

指标需要划分很细致,侧树状指标结构展示品牌总分,场景

testpppppp commented 1 year ago

blog

https://imzhanghao.com/2022/08/20/cognitions/

https://kexue.fm/archives/8046 避免挑选简单的路 rogue计算按照词还是字(出发点是专有名字要匹配上,但是模型更倾向符号单字词,因为权重一样) softmax在finetune改为sparse版本,防止为了不必要的拉大差距过拟合

关键词抽取 UCPhrase JointKPE https://www.yuanhao.site/%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0/2022/03/26/key-phrase-extraction.html

NLP为主 下游任务是什么? 找到文本处理不置信的情况?

不错博客 https://www.yuanhao.site/%E7%AC%94%E8%AE%B0/2023/02/09/%E4%B8%80%E6%9C%88%E8%AF%BB%E4%B9%A6%E7%AC%94%E8%AE%B0-%E5%AF%BB%E6%89%BE%E7%9B%AE%E6%A0%87.html https://imzhanghao.com/2023/02/24/chatgpt/#34-gpt

testpppppp commented 1 year ago

https://zhuanlan.zhihu.com/p/557883914 https://imzhanghao.com/2022/01/18/how-to-get-rich-without-getting-lucky/

今天把番茄时钟也用上,每日记录也用上(每年pdf一下) 家人的作用是⏰

阐述的是学习的动力问题。如果我们感受不到做一件事情的意义,我们就会缺少做它的动力。学习也是如此,学“能力”而不是学“知识”,“学未来”而不是“学现在”。因此我们要学会主动赋予做一件事的意义,并且是积极的意义。

有一个很生动的例子你一定听说过:三个工人在建筑工地上砌墙,有人问他们在做什么,其中一个说在我砌墙,另一个说我在建大楼,还有一个说我在建一座美丽的城市。十年后,第一个工人还在砌墙,第二个工人成了建筑工地的管理者,第三个工人则成为了一个建筑公司的老板。