Closed HaoningChen closed 1 year ago
在构建另类数据因子时, 我们常常需要处理时间和instrument (甚至连名字都不一定精确匹配, 例如爬下来的是某类商品的新闻, 但是投资标的是大类商品下的一个个具体期货合约) 不连续的另类数据与结构化的量价数据的合并问题, 在合并时可能需要花费大量的时间精力。但如果有一个查找引用的函数, 这项任务的难度将大大降低
例如需要使用期货量价数据和大类商品的新闻数据, 对每个期货合约计算 no news is a good news 因子:
我们将面临datetime和instrument不匹配的问题, 即使用pd.merge()也不能很好地解决, 但如果有一个查找引用函数就能完美解决问题(尤其是解决模糊匹配的问题)
已解决,见vlookup
在构建另类数据因子时, 我们常常需要处理时间和instrument (甚至连名字都不一定精确匹配, 例如爬下来的是某类商品的新闻, 但是投资标的是大类商品下的一个个具体期货合约) 不连续的另类数据与结构化的量价数据的合并问题, 在合并时可能需要花费大量的时间精力。但如果有一个查找引用的函数, 这项任务的难度将大大降低
例如需要使用期货量价数据和大类商品的新闻数据, 对每个期货合约计算 no news is a good news 因子:
我们将面临datetime和instrument不匹配的问题, 即使用pd.merge()也不能很好地解决, 但如果有一个查找引用函数就能完美解决问题(尤其是解决模糊匹配的问题)