issues
search
dantezhao
/
data-group
77
stars
12
forks
source link
issues
Newest
Newest
Most commented
Recently updated
Oldest
Least commented
Least recently updated
【问题】 如何打通产品多端的埋点数据,如何把他们识别为同一个客户?这个有好的解决方案么?
#31
detectivelcy
opened
6 years ago
0
【问题】 app数据采集可能会存在数据上报延时,倾向于采用数据的生成的时间还是服务器收到的时间?
#30
detectivelcy
opened
6 years ago
3
【问题】怎么控制埋点数据传输流量?
#29
detectivelcy
opened
6 years ago
0
【问题】对于提升埋点数据效率,有什么坑可以规避,有什么经验可以分享。
#28
detectivelcy
opened
6 years ago
0
对语言模型M0和M1做线性插值,M_=aM0+(1-a)M1。得到的模型更好吗
#27
dantezhao
opened
6 years ago
4
[DISCUSS-3] 数据仓库中数据管理的讨论
#26
wxs85
opened
6 years ago
2
增加DataTalk的一些内容
#25
RebieKong
closed
6 years ago
0
逻辑回归的连续型变量分箱处理问题
#24
RebieKong
opened
6 years ago
2
埋点数据采集与企业数据资产建设(如用户画像)怎样更好的合作?
#23
RebieKong
opened
6 years ago
2
如何做好埋点工作和研发的协调和落地?怎么进行埋点工作的验证和效果评估?
#22
RebieKong
opened
6 years ago
1
如何进行数据埋点方案及规范的定义,以及后续怎么进行维护和管理?
#21
RebieKong
opened
6 years ago
2
app与web在基础数据的要求有所不同,如果app和web共同为同一业务服务,这两者之间的数据如何进行汇总处理?
#20
detectivelcy
opened
6 years ago
1
[DISCUSS-2] 机器学习的算法和模型讨论
#19
RebieKong
opened
6 years ago
0
关于从kafka消费到的实时数据如何在存入存储介质前去重的疑问
#18
hemaGitHub
opened
6 years ago
2
通过订单表计算新客和用户下单留存应该怎么设计模型
#17
datayie
opened
6 years ago
1
是不是数据量越多越好,怎么样能产生有意义的计算数据,有意义的数据不是很多,如何使用起来是个大问题,是否可以得到结论:一定要这么多数据
#16
zhanglei738
opened
6 years ago
0
TF训练的模型在不同的集群上落地有什么经验
#15
zhanglei738
opened
6 years ago
0
如何理解数据集成和DMP的关系
#14
zhanglei738
opened
6 years ago
0
在做机器学习的过程中,拿到数据,确定了你要做的是分类还是回归,那么你经常还会基于什么来选择机器学习模型?
#13
ghostband
opened
6 years ago
1
[DISCUSS-1]指标系统的主题讨论
#12
RebieKong
opened
6 years ago
0
为什么把特征组合之后还能提升,反正这些基本都是增强了特征的表达能力,或者说更容易线性可分
#11
ghostband
opened
6 years ago
3
SparkStreaming如何有效的结合hdfs中的历史数据和接收的准实时数据进行聚合运算?
#10
AlanHand
opened
6 years ago
3
用户标签系统是怎么构建的?
#9
dantezhao
opened
6 years ago
2
关于数据分层有什么好的建议?
#8
dantezhao
opened
6 years ago
1
ods有的公司说几乎不处理,有的说这一层要做第一次数据清洗,大家怎么看?
#7
dantezhao
opened
6 years ago
4
数据相关的个人主页推荐!
#6
dantezhao
opened
6 years ago
1
数据更新频率比较高的需求适合用Hive吗,有什么比较好的解决方案?
#5
dantezhao
opened
6 years ago
7
如何衡量推荐策略之间的互相影响作用?
#4
cathyxlyl
opened
6 years ago
1
极少量数据变化的场景下,如何保证大数据平台数据与上游系统一致
#3
hongsong2021
opened
6 years ago
7
sklearn只能处理数字型数据吗?还有one-hot编码就是哑编码吗?
#2
ghostband
opened
6 years ago
2
在设计数据表的时候,是一个宽表好,还是多个维度表好?
#1
dantezhao
opened
6 years ago
5