(6)一起用python之基础篇——数据结构

Posted on: 2014-08-27 19:58

Posted in : 一起用python,

(撰写中。。。呃,写着写着,发觉其实原书写得很系统,一环扣一环,我这样子抽出来一点点地分析反而打乱了原有的结构。我这里写的,大致看下就好,不多说了,反正如果学习Python和数据结构的话,这本书非常非常推荐!)

写在前面

本来,这部分计划在几个月前就完成的,无奈这中间忙其它事去了,断断续续地写了一点点。现在刚好闲下来了,争取正式在实验室开始干活之前把这部分写完。加油~

依照以往学习编程语言的经验,在熟悉了语言的基本语法和标准库的应用后,需要进一步深入到底层基本数据结构。一方面深入理解python中常用的数据类型是怎么实现的,另一方面通过自己实现这些基本数据结构来掌握python中类的写法。 于是我大致找了一下python下数据结构方面的书,对比后发现Data Structures and Algorithms in Python这本书灰常好。其优点在于,非常适合本人的学习路线(粗略熟悉了python的使用,但是缺乏深入了解),而且本书的前面几章提供了很好的过渡。此外,对于各种类型的数据结构 ...

--- Read More ---

阿里数据挖掘竞赛之自我总结——秋田君

Posted on: 2014-08-04 16:53

Posted in : competition,

我是怎么开始做这个比赛的

忘了具体是哪天,反正三月的某个傍晚,我正在往github上传MLAPP中python部分的代码,邱泽宇打电话问我,阿里有个数据挖掘的比赛,有兴趣参加不?思考了3秒钟,我答应说,行。随后看了下比赛细则,感觉进个前五十应该不是太大的问题(要知道我们报名的时候才一百多队,这点自信还是有滴哈)。所以一开始的目的,不过是希望能够借助比赛这个形式,在第一季熟悉下scikit-learn机器学习的包,然后将上学期学过的一些机器学习算法在这个数据集上实践一下,把基础打扎实。至于第二季,就是希望能借助阿里的分布式平台,进一步熟悉下用怎么用mapreduce写一些常见算法,由于第一学期云计算的课只是在虚拟机下跑了跑,感觉不够尽兴,一想到有这么个免费平台跑大数据,这感觉应该很爽~

得承认,之前毫无做这类比赛的经验,我低估了比赛的实际难度。抱着打基础的目的而去,结果比赛的整个过程异常激烈,所需要的知识也远不止基础算法,而是涵盖了模型、特征等等更多外围的东西。而且进入第二季后才发现,自己动手在odps上写算法是一个异常艰巨的过程,很大程度上只能依赖odps上已有的几个算法。以至于做到后面有种骑虎难下的感觉,接着做下去吧,感觉花大量时间在上面收获不是特别大 ...

--- Read More ---

[Share]By My Love

Posted on: 2014-07-05 23:34

Posted in : Essays, Love,

交报告了,兰州党组织注意接收~

写的很散乱,不知该怎么整理,请党谅解这个‘读书不多又特爱思考还他妈话唠综合症’患者···

首先特别想念各路江湖朋友,看大家武艺都蹭蹭蹭姐的心情那叫一个越过羡慕嫉妒直接恨,所以这一年大部分都鲜有来往,请理解一个曾经飘过你们地盘的落魄灵魂~ 我还是不知道怎么开始·····

——我是分割线——

貌似我应该先说说考研这点事,像我这种跨专业跨学校跨地区的‘跨父’的日子肯定不太容易,姐跨的专业是MTI(汉语叫翻译硕士,不是MIT~)姐跨的学校是外交学院(不要问我全称不要问我哪里的外交学院人家就叫外交学院!)关于进外交学院有多难我不想说,因为说了你也不会信,关于试题多百变多百科我也不想说,因为不好说,关于这一路具体有多辛苦我也不想说,因为好像没什么必要说,并且除了同考外交的人和与我最亲近的人应该没人真的能体会。客观事实就是我毕业时瘦了10斤,复试时体检身高168体重47-,因为网络纸质信息都约等于0,所有的艰难都是心理折磨太多,12年下半年基本是走在马路上都会莫名泪飚的日子,后面几乎每晚难以入睡,不过真正艰苦的日子就那一年,后来就好多了,因为缺的只是努力

都劝我先找个工作,我当然知道工作可以赚钱 ...

--- Read More ---

一张图说cuda

Posted on: 2014-05-13 17:35

Posted in : cuda,

cuda.jpg

点击看大图

没去上几次高性能计算的课,有不完善的地方还请见谅。赶在明天考试之前复习了下课件,加上自己的一些理解随手画了画。

说说自己对并行计算的一点浅显认识。以前一直以为,并行计算嘛,就是fork出进程然后各干各的,最后汇总下结果。但发现实际中并行计算往往并非是完全独立的,相反,各个进程之间往往需要各种同步和交流机制。这在一定程度上对编程能力提出了巨大挑战,一方面需要对任务进行分块,另一方面需要自己控制好同步和交流的节奏(弄不好就出现计算结果飘忽不定的情况)。也就是说,原来在串行程序中根本不会出现的资源读写问题,到了并行程序里可能就会成为大问题。许多事情都需要自己手动控制好,就算再有耐心的程序猿看到了也会有些抓狂。只能寄希望以后某一天编译器可以变得足够智能,把苦逼的程序猿解放出来。另外不得不说,pycuda的封装做得很好,只是我没比较过性能上的差异。

为了写大作业,我不得不重拾很久都没碰过的c语言。嗯,指针真是个好东西,有时候真是无比怀念啊......不过,数组越界的问题,完全靠自觉了......唉,凡事都是有得有失。不过我觉得自己应该不会再用c来并行计算了,如果可以,我还是更愿意用一些高层的语言来写 ...

--- Read More ---

给自己放一天假~

Posted on: 2014-03-16 18:41

Posted in : pictures,

给自己放一天假,整理下心情~~~

--- Read More ---