Closed will-ww closed 1 year ago
好的,我仔细看了一下,并根据之前的会议的内容归类了以下几个需要明确的点:
几个参考资料,有指标可以参考:
刚刚花了几个小时,找到了这个方法:
现已转换并导入其中。
这种方法会有如下的问题:非常费时,同时没有办法及时更新。
展示的图片如下图所示:
示例包含:
Cool~
现在看来仍然存在以下几个问题:
根据“宣传openrank”这一需求我们还是需要之后要在该大屏中加入openrank数据,并尽可能的保证所展示的数据可以显示出一个项目的“openrank”分数和以它为核心的COSS startup的融资规模有一定正相关性。
根据“宣传openrank”这一需求我们还是需要之后要在该大屏中加入openrank数据,并尽可能的保证所展示的数据可以显示出一个项目的“openrank”分数和以它为核心的COSS startup的融资规模有一定正相关性。
对的,我们一起来想想~
OCR直接转成的原始数据会如下所示:
无法直接使用,所需要的数据清洗和整理代码如下:
import pandas as pd
import calendar
df = pd.read_excel('path/to/file.xlsx')
def month_from_string_to_int(month_string):
month_num = list(calendar.month_name).index(month_string)
if month_num < 10:
return '0' + str(month_num)
return str(month_num)
df['Year Announced'] = df['Year Announced'].apply(lambda x : str(x))
df['Month Announced'] = df['Month Announced'].apply(lambda x: month_from_string_to_int(x))
df['Round Size(M)'] = df['Round Size(M)'].apply(lambda x: x[1:] if type(x) != float else x)
df['Time Announced'] = df['Year Announced'] + '-' + df['Month Announced'] + '-01'
df.to_excel('path/to/file_new.xlsx', index=False)
最终效果应如下图所示: