[更新需求] 需要同步更新 OpenPerf 仓库的内容

X-lab2017 / open-perf

Benchmark suit for large scale socio-technical datasets in open collaboration

MIT License

11 stars 18 forks source link

Open will-ww opened 1 year ago

will-ww commented 1 year ago

WISA 的稿件已经投出，即将进入审稿阶段，需要同步更新本仓库中的内容，以和文章中论述的一致。

请大家一周内陆续将本仓库的内容进行更新~ @bifenglin @PureNatural @birdflyi

大家可以在本帖下分工与讨论~

PureNatural commented 1 year ago

第3章一共有9个任务需要通过readme文档介绍，第4章有3个任务需要给出实验结果，5.1有两个指数类基准和一个标杆类基准，分为15个小段

我们的目录应该也有两级

任务类

指数类

标杆类

指数类两个基准、标杆类基准、3.3 开源社区情绪分类、 3.6 开源归档项目预测就由我来完善吧

bifenglin commented 1 year ago

从工程化角度，我认为得从suit架构层设计以下，需要规范下类别的接口。最终client端可以分为两类：

example script：一段调用封装好的函数，然后进行训练，并且输出，包括 data_loader, data_process, train, evaluration, result 5个方法的调用。
openperf_cli: 一个command client，直接根据输入的参数自动执行上述功能。

但是不妨碍大家先把自己完成的基准放进openperf里面，然后统一进行重构。另外指数类、标杆类基准很难把全部数据加载到内存进行计算，因此我建议直接放上实现方式（若有），然后将openleaderboard的数据输出即可。

bifenglin commented 11 months ago

@PureNatural 可以按照 bot_detection的样例，完成os_sentiment的内容，结果如图：