字:
关灯 护眼
啃文书库 / 未分类 / 在海外读博的日子每天想的是什么 / 第四章:算法提高 60 倍!(1/1)

第四章:算法提高 60 倍!(1/1)

章节出错了,点此刷新,刷新后小编会在两分钟内校正章节内容,请稍后再试。

  这些天来,每日学习已经没有痛苦。但是睡眠习惯还是很差,一般都1点睡,但是得10点11点起来才有精神。所以一个人需要多久才能适应新的睡眠周期呢?我要问问gpt4。
  1.讲道理基础数据集也得重新跑,事实证明初始阈值还是很重要的。先等hyper跑完先吧,不着急一次性全跑了。
  2.cover还是个麻烦,目前无法一直retrain
  3.如何再加快点?
  4.趁写综述的时候,把gpt那个项目弄起来,这样可以扫很多论文。
  casestudy1:发现普通数据集下还有问题
  1.sea0seed=2epoch=98,还是会过于敏感,把没有errorrate下降不多的漂移也检测了出来
  2.用NN的问题是直接训练就会很牛逼。。。但是为什么baseline利用NN的效果比我们还好呢?那只能是NN的residual的太不可靠了,飘忽的很。有没有办法让它稳定可靠点。。
  3.hyper最好的效果竟然是直接不检测,而cover恰恰相反,应该一直检测。。
  4.但我认为不应该再对数据集进行优化了,相反,我应该思考如何提高这个方法本身。
  1.我可以修改搜索的方式,保存model,这样只需要继续学习就行,就可以大大加快测试速度,这个很重要【现在就搞这个,搞完了,现在5分钟就跑完一个,速度提高了60倍】
  2.我需要思考如何让NN提供可靠的calibration
  3.我需要思考如何快速搜索threhsold,不要反复横跳
  4.我需要更多数据集
  5.单个chunk也检测【cover的处理,正在】
  在等待的过程中,我重新看到了学习观的帖子,原来他们已经做这么大了,而且创始人的想法跟我的非常接近,但他比我强多了。我最近几天应该把他的视频重新刷一下。
  可以了,GNB已经不错了,明天思考下NN的事情。
  今天她喝了冰红酒,喝了之后跟我打电话还挺开心的,从作业的压力中缓过来不少,啪一下,很快啊,乐极生悲,因为胃不好闹肚子痛了,一个小时了现在还没缓过来。害,下次她再喝酒我得先问一句是不是热的。
  
热门推荐