pigbreeder / CodeMemo

1 stars 0 forks source link

unicode #12

Open testpppppp opened 1 year ago

testpppppp commented 1 year ago

https://blog.csdn.net/jlulxg/article/details/84650683 https://www.cnblogs.com/csguo/p/7401874.html remove char

import re
title = '✦Hush Puppies Mens Shoes Payne Wing Tip Black Leather✭'

title = re.sub(r'[^\u4e00-\u9fa5\u0030-\u0039\u0041-\u005a\u0061-\u007a\u0E00-\u0E7F\uAB00-\uAB5F]',' ',title)
title = re.sub(r'\s+', ' ',title).strip()
title
testpppppp commented 1 year ago

我们目前的场景也不是直接用ab的数据,而是基于用户的历史数据建模得到用户的lift打分。 Bert输出 the returns of the BERT model are (last_hidden_state, pooler_output, hidden_states[optional], attentions[optional])

output[0] is therefore the last hidden state and output[1] is the pooler output.

output = model(input) # 4 content hidden_states = output[0] # b,s,h first_token_tensor = hidden_states[:, 0] # CLS, bsz, hid

testpppppp commented 1 year ago

训练打手和狗腿的方式;努力总管

数据分析算法工业实践 https://zhuanlan.zhihu.com/p/569932238 设备故障预警 故障诊断 设备的运行优化 健康评估 IT计算能力、DT数据分析能力、工业领域的知识OT

生成的问题 基于预训练语言模型的可控文本生成研究与应用 https://zhuanlan.zhihu.com/p/588273776

发散;逻辑不一致;知识正确;语句重复;细粒度

todo

小米知识图谱 https://zhuanlan.zhihu.com/p/566627694 SOP(subject predicate object 主谓宾) POI(point of interest) 别名挖掘(行为数据/抽取式) mention可以理解为粗略的分类,即知道这个ngram是个实体,但是不知道其是哪一类。

人群的鉴别能力,反省能力和反专制的行动能力 见人说人话见鬼说鬼话,反省

业务中,知识图谱更多的是把用户和商户、用户和商品做一个连接。其实只要通过构图能够提升它的表示或增强了解,我们认为图谱都是有用的,都可以通过构图来学习。

横向扩展,专家讲师

君子上交不诌 下交不渎

开脱:超越个人秉性的解读

testpppppp commented 1 year ago

角色代入

移植记忆 不是真的经历过,不好否认它。被动接受 操控事实(竞争性真相) 一件事情通常有不止一种真实的表述方式。我们在生活中都有过类似的经历,对于同一件事,两方都觉得自己的做法才对,无法达成共识。

如果这样,讲道德问题。不是改变这个人,而是改变别人怎么看待这个人。

要满足对象对一个亲密关系的想象。

每一个坏行为后面都是需求,找到这个需求

testpppppp commented 1 year ago

一些资料 http://nlpir.org/wordpress/wp-content/uploads/2022// http://www.nlpir.org/wordpress/wp-content/uploads/2021/11/ http://www.nlpir.org/wordpress/wp-content/uploads/2021/10/

ner

http://www.nlpir.org/wordpress/wp-content/uploads/2021/11/17-%E4%B8%93%E7%94%A8%E5%91%BD%E5%90%8D%E5%AE%9E%E4%BD%93%E6%8A%BD%E5%8F%96.pdf

非连续/嵌套ner怎么处理;用生成的方式 https://github.com/yhcc/BARTNER https://zhuanlan.zhihu.com/p/379615822

◼NEEDLE(强弱标签结合) 规则生成数据 https://bbs.huaweicloud.com/blogs/297057 使用prompt模版 xx is yy, zz is not yy.正负样本

分类问题后处理技巧CAN,近乎零成本获取效果提升 批次分类,使用多样本均值回归的方式

Named Entity Recognition with Small Strongly Labeled and Large Weakly Labeled Data https://blog.csdn.net/xixiaoyaoww/article/details/119194054 弱样本使用,原有已知样本作为权重调节

testpppppp commented 1 year ago

VUE3入门级全栈项目实战-博客开发教程(完结) https://www.bilibili.com/video/BV1t3411F7VH/?spm_id_from=333.337.search-card.all.click https://github.com/github1586/nuxt-bnhcp

Vue实战篇(Vue仿今日头条)

https://segmentfault.com/a/1190000013153782?utm_source=index-newest https://github.com/liangxiaojuan/vue-todos

微信小程序

眼镜店小程序 https://juejin.cn/post/7049613859832889351 https://github.com/SkyRecovery/SkyRecoverMini

是什么 有什么(组成概念) 关键词是什么 之间的关系是什么

testpppppp commented 1 year ago

calibration

https://github.com/Lingkai-Kong/Calibrated-BERT-Fine-Tuning 代码理解 https://github.com/Lingkai-Kong/Calibrated-BERT-Fine-Tuning/blob/main/manifold-smoothing.py#L87 回顾梯度定义 https://www.cnblogs.com/pinard/p/5970503.html (变化最快的方向) 为什么有个sign函数,其实就是一个梯度下降,cosim距离,期望更小。找到距离最近的点 inv_index 是快速的找到pair 88行是限制搜索范围不要太大,控制在epsilon内。

testpppppp commented 1 year ago

NER 技巧 https://zhuanlan.zhihu.com/p/326302618 漏标怎么办? 《Empirical Analysis of Unlabeled Entity Problem in Named Entity Recognition》,就是采用我们上述提到的「片段排列」标注方式,摒弃传统的CRF序列标注、与序列长度解耦,转化为一个对span的分类问题,这样更适合对负样本实体的采样;这样模型建模不会像对序列标注中的漏标过于敏感,也更好控制

伪数据生成 标注数据模型训练完之后,在无标签上预测。

使用conditional layernorm 控制作为条件生成

Biaffine双仿射注意力机制,实体的头尾更紧密联系交互

testpppppp commented 1 year ago

组织中 溯源与思考——以“特别军事行动”镜鉴谢尔盖·绍伊古的十年治军路 战争本身发现并选拔干部,战争环境比任何一个干部机关都能更好纠正其与最高统帅部在战前一些岗位的人事任免中所犯的错误,并逐步让这些无法克服复杂环境的干部靠边站。

- 为什么选他
- 他做什么?没有军队经验,无从发现问题,如何工作寻找突破口
    - 恢复了中断近20年的战备突击检查制度(发现问题,否定之前借此机会改变权力架构)
    - 以10位副部长辅佐绍伊古主持工作,此举大幅稀释了俄军总参谋部的权力;
    - 稳定军心;纸面上扩充了军队规模,直接增加了高级军官的岗位数量,是绍伊古笼络人心、凝神聚力的关键举措
    - 第二件事是要在短期内以看得见的变化彰显其对“新面貌”的调整成效。
        - 建设;心腹去建 指挥中心/基地/洗浴
    - 证明前任政绩不彰、增加编制稳定队伍、狠抓“看得见”的工作
- 让俄军打几场规模可控、能力可及、难度不大的“小仗”,以期俄军在自己主导的调整改革下能迸发出焕然一新的表现
- 核心目标
    - ①让俄国民众觉得俄军“行”;
    - ②让俄国对手觉得俄军“行”;
    - ③以行动证明俄军“真的行”

老梁:为官之道 其上申韩者 其下必佛老 巧官是怎样炼成的

testpppppp commented 1 year ago

重点是什么(leader tell u which is important) 这个问题普遍么,严重么 you can't be shamed of who you are 做回你自己,或者回去一辈子没有答案

足球刚开始是热爱,最终成为标准化生意;医生也是,标准执行手册,差异化空间变窄,执行者的角色没有价值

情感:开盲盒

口罩ps文件通关,熟悉才懂,熟人才能送 网盘搜索;地铁信息;白嫖汇总;电子书 印度药,倒买倒卖 sg一个房间做猫寄存(喂药/其他服务/监控) 政府项目,运动给返现;图书馆给补贴,文化飘香 telegram有趣内容抓取,badnews,数据源抓取 sell给谁?

考虑把宠物周边做起来
咨询,交易,购物,医疗,殡葬全部拿下
整个模型出来之后,拉投资。
拉到投资做产品。
产品出来之后,砸钱养招牌。
招牌有了之后,吸引商家入驻。

宠物市场很庞大,未来人的精神寄托会有很大一部分转移到宠物身上,所以需求有了。不过这个东西要做就做最大最好的,要不然很难挣大钱

造神
社会精英编造这些并不高明的谎言 本质的驱动力是在进行造神运动,和皇帝出生都要“天有异象”玩儿的是一套把戏。一旦造神成功精英们就可以长期高效而无风险的套利,因而这种把戏千百年来经久不衰。古代社会造神运动能一直玩下去的一个重要原因就是这些谎言无法证伪,而真正有资格也有能力戳破谎言的人也必然是造神大队中的一员,站出来“打假”对自身有百害而无一益。时光流转 现代科技的发展让那些本应在权贵阶层内循环的人设和信息流不可避免的飞入外围精英圈 而让他们也产生了可以造神的幻觉。这些“二线精英”最大的错误在于过高的估计了自身占有资源的稀缺度 他们和平民阶层并没有形成实际的信息壁垒 因而造神把戏很容易就被拆穿 谷的错误也不例外。

应该让别人怎么看你的人际关系?

testpppppp commented 1 year ago

https://www.cnblogs.com/eliwang/p/15260822.html # python爬虫--利用selenium+opencv识别滑动验证并模拟登陆知乎 ;使用chrome的远程调试模式结合selenium来遥控操作chrome进行抓取,这样就会规避selenium被网站检测到

https://www.cnblogs.com/eliwang/p/14365056.html # selenium操作

https://cuiqingcai.com/202262.html # Playwright 新框架 https://testerhome.com/articles/30486 # 新方案

testpppppp commented 1 year ago

SimilarWeb 网站竞品查看

https://tophub.fun/ https://tophub.today/ 谁受到新闻影响,之后做什么

AI logo生成 https://v2ex.com/t/906545#reply10

testpppppp commented 1 year ago

concept

what 和why搞混,到一定程度分不清 冬天水管爆裂,所以不能放水 不能放水,水会结冰,体积大涨破 水会结冰,分子直接有序,空间大 有序空间大,温度低会有序空间大

感受更多生活,发掘自己热爱,更多头脑中的关联素材,这个方向比拼的是什么(钓鱼,滑冰,比什么,什么好,如何欣赏不完全一样,角度不同)

testpppppp commented 1 year ago

做任何事,要想一下,我要关注什么,要领是什么,竞争点在哪 人生就是123 2:附着点,场景,主体,与另一个只见的关系 3:序列,桥梁,adapter

意义是人赋予的,要么附和你要么否定你,真实怎么做自己判断。

走路说话弹琴学习方式 是理论可解释还是基于反馈调整两种方式。感性和理性结合,进步创新可解释性复现。快速到60分塑造信心构建基本反馈的过程 直接学理论,没有感觉的学习。说话和写文章,更精准描述

高手的破局战略:找到自己的高价值区——让自己成为某个领域的头部——再借助头部效应的系统推力,从一个小头部不断地向大头部移动,实现跃迁。持续打造高价值作品,通过作品获取反馈。许三多修路,会整活~,自己都觉得自己重要了。

testpppppp commented 1 year ago

认知觉醒

引言

心智:看待人和事的态度,以及由此做出的判断和选择 醒着的睡着的人:对自己不了解,对生活没主张,对命运无选择。 五年十年后还是老样子,还是收获一个全新的自己,对生命有感悟的自己

认识大脑

构造

本能脑:低级强大,基本生存 情绪脑:主管情绪 理智脑:弱小高级 成熟时间2-12-22;神经元归属数量也是递减。 所以目光短浅即时满足是天性。

人类是自我解释的动物,我们以为的思考很多时候是对自身行为和欲望进行合理化。 成长就是克服天性的过程,善于利用三种脑,不是对抗而是协作。

认识焦虑

人类的安全感来自自己在某一方面拥有独特优势,能力/财富/权利/影响力。 焦虑的几种形式。

原因:同时做很多事,又想立刻看到效果。 欲望上急于求成,行动上趋易避难

耐心本质

人类天性中本能:即时满足。 人们当然愿意相信:毕竟保持心性单纯比保持努力容易太多了,这种不用付出巨大努力就能获得超强能力让人心驰神往。 误解:忍受无趣,承受痛苦硬扛到底用意志力去对抗。

为什么?看不到全局,不知道自己身在何处,所以总拿着天性这把短视的尺子衡量。

复利曲线 : 前期增长非常缓慢,到达一个拐点后会飞速增长(非线性思考) 舒适边缘区 : 拉伸区,已知到未知间的过度区域。 学习权重占比 : 改变量,行动量,思考量,学习量 成长曲线:平台期,脑子中神经元还在建立链接,有感知的学习不会停止。 耐心与毅力无关而是具有长远目光的结果 保持耐心:让本能脑感到愉悦,变对抗为沟通协商,接纳缺乏耐心的自己

做到耐心

接纳自己;延迟满足;改变视角赋予行动意义

消除模糊

认识模糊

人生是消除模糊的大赛,终身学习掌握工具越多认知越强,消除模糊越强。 受苦难比解决问题来的容易,承受不幸比享受幸福来得简单。 什么是重点?人生每时每刻都在决策 无法认清,无法正视问题,舒适区边缘

回避痛苦会让问题转为潜意识变得模糊,模糊之后边界反而无限扩大,原本不小的困难反而会因模糊放大 苦难不会凭空消失,正视它从潜意识中挖出来才能解决

行动力不足的原因是选择模糊

情绪模糊

层层挖掘事情本质,主导情绪

选择模糊

确定赛道,拆分步骤到可执行降低难度,专注眼前

捕获感性

凭感觉 : 身体信号,第一反应,梦境,最,总,无意识的第一反应, 直觉, 身体(不舒服就停下来,状态不好就休息)

熔断读书法 : 有启发就立刻停止,为什么有触发,能扩展到其他地方么,凡是被某种事情击中就追问原因。先用感性帮自己选择,再用理性帮自己思考。(帮助找到拉伸区)

目标是什么 : 存放我们热情和精力的地方。如果每天吃喝不愁,但是内心没喜悦生活没激情人生没目标如同行尸走肉。

用感知力代替思考力《美好人生运营指南》,正确的答案往往是利他的,真正长久的人生意义和幸福只能从他人反馈中获得。

“我”的分层

本我意识:学习理解记忆运算

元认知 : 另一个自我,自己可以站在旁边第三视角审视自己,自我反馈,对思考过程进行认知与理解。意识到自己在想什么,我们说xx时候是在说xx么?

被动元认知/主动元认知 : 遭受挫折/苦难的反馈还是时时刻刻自己我反思。走神时的提醒,迷茫时的理清,生气时的梳理,无解时的深入底层寻找核心,懈怠时候站在人生终点警醒你。从高处,远处,深处看待现在的自己,视角切换(之前自己是从问题素材扩展角度理解这个问题)。

提升

目标

专注力

情绪专注+深度沉浸

行动力

注意力增强回路:起点做选择获取的正负向回路更容易

学习力

获取高质量知识-关联旧知识-自己话讲清楚-写清楚-实践

提升关联能力

保持好奇心+热爱的事情+摄入大量素材+是否可以泛化到其他方面

主动休息/专注学习

运动前复杂热身有利于调动身体 运动后到复杂脑力有利于身心合一 25+5番茄工作法

情绪力

心智带宽:贫穷和大喜大悲更耗费人的精力,降低判断力

心智富足

保持环境觉知 保持目标觉知 保持情绪觉知 保持闲余觉知 保持欲望觉知

克服惯性

转换视角 多反思 多运动

身心合一

缺乏感受的人对凡事都心不在焉 砍柴烧水做饭

匹配

拉伸区

舒适区的边缘适应成长。 扩展:孩子对自由财富的掌控程度决定了放权与鼓励的尺度

专注

专注的真正动力不是毅力,耐心,而是不断发现微妙差异和持续存在的关注点。精力越集中则感知越细微。

行动

判断标准

是否发生改变,是否结晶成为生命的一部分;是否能更细微感知周边觉知 生命更有感知

具体事情方法

元认知

观察-反思-判断-选择

从被动到主动,当一个人能主动开启第三视角持续反观自己的思维和行动,就是觉醒和成长的起点。 运用情绪脑:帮助自己找到筛选出触动点 运用理智脑:思考-关联-实践 抽象(上升一个层次才能看的更广,更普遍的内容),关联其他自己身上的点(跟平常说的xx很像,很什么很像?),扩展到自己遇到的问题联系应用

TODO list 早/跑/写/读/冥

反思:感触点

每天平常记录,晚上整理

描述经过-方便回顾 分析原因-多问几个为什么,直到有启发 改进措施-一个认知点或行动点,落实到结晶体

冥想:提升专注力

身心合一

对他人

情绪和意见分开,目标是自己成长

名言/比喻

每一次克制自己,就意味着比以前更强大 未来视角是现在行动的指南针 如果有一个问题需要1个小时,那我会用55分钟想清楚究竟在问什么 照相机:视角 结晶体: 反馈,这个世界的进化机制。(说话/走路/自行车) :弹钢琴的起初感性认识模仿,后期再理论

超越期待-如何经营好自己? 幻想图书馆-集恶趣味与冷知识于一身的代表作