August 05

今天早上起来就一直在看pandas相关的东西
最后一路补到correlation

但是即使明白了corr是干什么的
最根本的东西还是没明白
那就是到底怎么处理数据才是正确的
比如corr得到了某两col的数据的相关度很高
是不是就应该将其中一个drop掉?

然后是不是应该去掉outlier?
怎么清理数据才是正确的?
太多莫名其妙的事情了
这些知识点都很有用
只是对现在的我来说并不是很有用

昨天和今天沉迷kaggle
今天剩下的时间和明天又得回到RL里面去了