项目笔记:中期报告

大学生创业创新项目,如今到了中期回报的阶段,感觉没有做什么,单干劲儿也做了很多

当初分配任务的时候,我是负责爬虫和tk界面的,不得不说我一个人揽了这两个活也不算少了,相比其他人也算可以得了吧

这么久了,学到的不少,单是大部分都是使用技能而不是我所想象的,真的不想成为一个码农,码奴,该觉那样的生活乏味而没有意义

那样的生活跟混吃等死又有什么区别呢?哎。

总结一下吧:

python爬虫的历程:

urllib->requests->selenium+chromedriver->selenium+phantomjs

期间也研究了一下scrapy但也是到了如今这段时间了,心里想考研,但却抵触政治,但是还是把爬虫这块的工作撂下了

urllib是最简洁最方便的,但是太容易被封了,反反爬虫技术:建立Opener使用代理ip,sleep,都是比较简单的反反爬虫,意义不大,但是效率很高

requests可以构造头部,可以传参数,可以代理ip,可以加载一部分动态页面,不得不说,是要比urllib好一些的

selenium + chromedriver第一次接触是为了模拟登录,获取cookie带cookie访问,不得不说,还是蛮好用的,当初是结合着requests用的,不久前的一段时间才发现可以获取page_source属性,来直接分析,那样作用大大提升

selenium + phantomjs当初遇到js加载的页面时候的焦头烂额,问了好多大神,都说phantomjs是最简单的,要不就得找js函数,自己分析。。。当初翻来覆去没有用,自己说着喜欢新东西,实际上却发现,自己是更习惯接受一些旧的东西,而讨厌去学习新的东西。但是不得不说phantomjs是真的很好用的一个软件,用他直接就能加载动态页面获取动态加载后的源码,堪称神器也不为过。

pythonGUI界面设计的历程:

踌躇了半天,还是选择了tk界面,作为大创项目的设计模板的底层,当初卡死自己一段时间真的想放弃这个gui界面了,知道前天,收到群里面的大神的颠簸,多线程真是一个好东西, 把所有附带计算的功能函数都放到多线程里面,这样不会导致卡死,从昨天到现在,真是一路流畅,今天下午把整体的tk界面设计完成,功能也都实现了,哈哈哈哈哈哈哈嗝,估计快可以交工了。

python链接数据库:

在最近一个月的时候,自己打算找找实习,实习呢,看看自己的能力也就只能去做个爬虫了,虽然自己真的很想去做机器学习啊算法啊但是。。。哎不会,估计也就得等到研究生阶段再去学习了,看到了要求都是要回mysql的于是就一遍复习,一边把项目的数据库部分做了个设计,学习经历在文章列表中,都是一些知识回顾,中间还做了一个游戏的demo设计,哈哈哈当时也是比较闲,顺便拿来练练手,到后来就是码农的工作了,留下了创意和数据,就把它扔下了。然后结果呢,呵呵,nmb老子高考好赖考了670的人吧,在大学虽然不是高中那样的精益求精,但专业课绩点也在3.0以上,均分80+,你tmd连个一面都不给我???在我要求都满足的情况下???跟我搞笑呢,恩?现在打算找考研吧,哎。

大概就这些,明天放假回家,接下来5天估计不会更文章了。

展示下我的tk界面


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章