Python語言是一種典型的腳本語言,簡潔,語法約束少,接近人類語言。有豐富的數(shù)據(jù)結(jié)構(gòu),例如列表、字典、集合等。具有可移植性,支持面向過程和面向?qū)ο缶幊?,并且開源。以下是小編為你整理的如何開發(fā)學(xué)習(xí)python ?
下載安裝:從python官網(wǎng)下載開發(fā)和運行環(huán)境程序。本例下載python-3.3.3.amd64的安裝包,并安裝。 ?
開發(fā)工具:window系統(tǒng)中,python有多種開發(fā)工具,比如,一、直接在cmd命令窗口執(zhí)行,但此種僅能單條語句執(zhí)行,不能運行完整的程序。二、python自帶的集成開發(fā)環(huán)境,可通過開始——所有程序——python3.3——IDLE(Python GUI)啟動。三、其他集成開發(fā)環(huán)境,如PythonWin等,有編輯和調(diào)試能力,還實現(xiàn)了MFC類庫存的包裝。
?
本例中,使用python自帶的開發(fā)環(huán)境。File—New File,新建py文檔,編寫程序,保存。Run——Run module,可得到運行結(jié)果。 ?
封裝性:可以把屬性、方法結(jié)合在一起,不可以直接訪問對象的屬性,僅能通過接口與對象發(fā)生聯(lián)系。以下把方法和屬性封裝成了一個類。 ?
構(gòu)造器:python有3種類型的構(gòu)造器,且一個類中僅可以定義一個構(gòu)造器,若多個,則以*為準。1.若不聲明,則默認為一個沒有任何操作的特殊的__init__方法,__init__(self),此時可通過obj = my_class()聲明實例。 2.自聲明__init__構(gòu)造器,會覆蓋默認的,且可以更新類的數(shù)據(jù)屬性。3.構(gòu)造器方法__new__(),用于不可變內(nèi)置類型派生,不能通過實例訪問屬性,僅能通過類訪問。 ?
繼承性:python支持多繼承,且子類繼承了父類的方法和屬性。若子類中有和父類相同名稱的方法,則子類會覆蓋(Override)父類方法。父類方法依舊可以訪問。 ?
數(shù)據(jù)結(jié)構(gòu):有豐富的數(shù)據(jù)結(jié)構(gòu),例如列表、字典、集合等。本例簡單介紹字典的使用。字典是鍵值對的無序集合,是可變對象。鍵在字典中是*的且必須是不可變對象。值可以是可變對象或不可變對象。以下例子對python字典的定義、訪問、更新等的操作。 ?
學(xué)會python的作用
Python高級工程師 : 北上廣深的話,薪金在1萬以上,需要精通Linux/Unixg平臺,有英語閱讀功底。 ?
Web網(wǎng)站開發(fā)方向: 熟悉Web開發(fā)的常用 Python框架,熟悉掌握Mysql類數(shù)據(jù)庫的操作即可。 ?
SEO工程師: 為自己或公司開發(fā)和改進SEO相關(guān)軟件,實現(xiàn)自動化搜索引擎優(yōu)化和日常重復(fù)工作。 ?
Python自動化測試:熟悉自動化流程、方法和常用的模塊的使用,有英文讀寫的能力。 ?
Linux運維工程師: Linux服務(wù)器管理,數(shù)據(jù)分析、自動化處理任務(wù)、分析網(wǎng)站日志、定時計劃管理,解放雙手。 ?
Python游戲開發(fā)工程師: 網(wǎng)絡(luò)游戲后端服務(wù)器邏輯的開發(fā)和處理,有大型數(shù)據(jù)庫使用經(jīng)驗,喜歡從事游戲相關(guān)工作。 Python自學(xué)愛好者: 可以自己開發(fā)一些小軟件和應(yīng)用,帶圖形化界面的軟件,方便日常工作。 ?
如何導(dǎo)入re模塊
導(dǎo)入re模塊 ?
#導(dǎo)入正則表達式模塊 ?
import re ?
再來一個簡單的例子演示 ?
#簡單演示 ?
s='123abc123abc123abc' ?
print s ?
print re.findall(r'123',s) ?
#'r'...''表示raw字符串 ?
#功能字符:'.','*','?','^','$','/' ?
#分界符:'[',']','(',')','{','}' ?
#轉(zhuǎn)義字符:'d','w','s','b' ?
#'|'表示或 ?
s='I have a pen and I have a apple' ?
print s ?
print re.findall(r'I have a pen|apple',s) ?
print re.findall(r'I have a (?:pen|dog)',s) ?
使用無捕獲組與一般或'|'的區(qū)別 ?
無捕獲組使用'(?:...)'格式 ?
#無捕獲組:'(?:)' ?
s='ababababba babab babababab' ?
print re.findall(r'/b(?:ab)+/b',s)
?
#'.'匹配除換行符之外的所有字符,若選用re.S則包括所有字符 ?
s='123n456n789' ?
print s ?
print re.findall(r'.+',s) ?
print re.findall(r'.+',s,re.S) ?
?
rllib.robotparser
robotparser 模塊是由一個單獨的類 RobotFileParser 構(gòu)成的。這個類會回答諸如一個特定的用戶代理是否獲取已經(jīng)設(shè)置了 robot.txt 的網(wǎng)站的 URL。 robot.txt 文件會告訴網(wǎng)絡(luò)爬蟲或者機器人當前網(wǎng)站的那些部分是不允許被訪問的。讓我們看一個簡單的例子: ?
>>> import urllib.robotparser >>> robot = urllib.robotparser.RobotFileParser() >>> robot.set_url('http://arstechnica.com/robots.txt') None >>> robot.read() None >>> robot.can_fetch('*', 'http://arstechnica.com/') True >>> robot.can_fetch('*', 'http://arstechnica.com/cgi-bin/') False ?
這里我們導(dǎo)入了 robot 分析器類,然后創(chuàng)建一個實例。然后我們給它傳遞一個表明網(wǎng)站 robots.txt 位置的 URL 。接下來我們告訴分析器來讀取這個文件。完成后,我們給它了一組不同的 URL 讓它找出那些我們可以爬取而那些不能爬取。我們很快就看到我們可以訪問主站但是不能訪問 cgi-bin 路徑。 ?
現(xiàn)在你就有能力使用 Python 的 urllib 包了。在這一節(jié)里,我們學(xué)習(xí)了如何下載文件、提交 Web 表單、修改自己的用戶代理以及訪問 robots.txt。 urllib 還有一大堆附加功能沒有在這里提及,比如網(wǎng)站身份認證。你可能會考慮在使用 urllib 進行身份認證之前切換到 requests 庫,因為 requests 已經(jīng)以更易用和易調(diào)試的方式實現(xiàn)了這些功能。我同時也希望提醒你 Python 已經(jīng)通過 http.cookies 模塊支持 Cookies 了,雖然在 request 包里也很好的封裝了這個功能。你應(yīng)該可能考慮同時試試兩個來決定那個最適合你。