不管你是待業(yè)還是失業(yè),在這個被互聯(lián)網圍繞的時代里,選擇如何做python,就多了一項技能,還怕找不到工作?,還怕不好找工作?小編就來告訴你這個專業(yè)的優(yōu)勢到底體現(xiàn)在哪里:cmd下載python不好使怎么辦,如何做python 線性回歸案例分析,如何用iPad運行Python代碼?,成功轉行Python工程師,年薪30W+,經驗總結都在這!??。
1.cmd下載python不好使怎么辦
貌似你的python安裝有問題或路徑設置有問題你的python.exe 怎么可能是在D根目錄?另外,可能你的python沒有完整安裝正常安裝 ,pip不會有問題的建議:重新安裝python重新設置路徑若是win10,建議不要安裝exe應用,而是從應用商店安裝 ,我安裝了3.8
2.如何做python 線性回歸案例分析
用Python實現(xiàn)線性回歸的小例子數(shù)據(jù)來源于網絡爬蟲,武漢市商品房價格為因變量和幾個相關關鍵詞的百度指數(shù)的搜索量為自變量。由于本文的自變量有98個,首先進行自變量的選擇,先是通過相關系數(shù)矩陣篩選掉不相關的變量,根據(jù)Pearson相關系數(shù)矩陣進行變量的選取,一般選取相關系數(shù)的值大于0.3的變量進行回歸分析,由于本文的變量較多,先進行手動篩選然后利用相關系數(shù)進行選取,本文選取相關系數(shù)大于0.55的變量進行回歸分析。經過相關系數(shù)的分析選取8個變量進行下一步的分析,分析的Python代碼如下:# -*- coding: utf-8 -*-#### Required sysreload(sys)sys.('utf-8')import .pyplot as pltimport numpy as npimport pandas as pdimport .api as smdata = pd.read_csv('Hdata.csv')print = np.array(data)######相關性分析X = dataset[:,1:98]y = dataset[:,0]cor = np.corrcoef(dataset,rowvar=0)[:,0]######輸出相關矩陣的*列print cor#######篩選后的數(shù)據(jù)讀取data1 = pd.read_csv('H1data.csv')dataset1 = np.array(data)######篩選后的變量######X1 = dataset1[:,1:8]Y1 = dataset1[:,0]est = sm.OLS(Y1,X1).fit()print est.summary()貼出線性回歸的結果如下:OLS =============================================================Dep. Variable: y R-squared: 0.978Model: OLS Adj. R-squared: 0.974Method: Least Squares F-statistic: 287.5Date: Sat, 08 Apr 2021 Prob (F-statistic): 9.35e-36Time: 15:15:14 Log-: -442.82No. : 53 AIC: 899.6Df Residuals: 46 BIC: 913.4Df Model: 7 Type: nonrobust ============================================================= coef std err t P>|t| [95.0% Conf. Int.]-----------------------------------------------------------------------x1 -0.3691 0.494 -0.747 0.0459 -1.364 0.626x2 0.3249 0.353 0.920 0.0362 -0.386 1.036x3 1.0987 0.837 1.312 0.0196 -0.587 2.784x4 0.7613 0.790 0.964 0.0340 -0.829 2.351x5 -1.5766 1.099 -1.435 0.0158 -3.789 0.636x6 -0.1572 1.077 -0.146 0.0885 -2.325 2.011x7 3.2003 1.603 1.997 0.052 -0.026 6.427=============================================================Omnibus: 0.413 Durbin-Watson: 1.748Prob(Omnibus): 0.814 Jarque-Bera (JB): 0.100Skew: 0.097 Prob(JB): 0.: 3.089 Cond. No. 95.5=============================================================從回歸分析的結果可以看出來,模型的擬合優(yōu)度R-squared=0.978,說明模型的擬合效果很好,據(jù)其大小對擬合效果的優(yōu)劣性進行判定。對模型整體的顯著性可以通過F統(tǒng)計量來看,結果顯示的F統(tǒng)計量對應的P值顯著小于0.05(0.05是顯著性水平,也可以選取0.01),說明模型整體是顯著的,它的顯著性說明被解釋變量能不能由這些解釋變量進行解釋,F(xiàn)檢驗是對整體的檢驗,F(xiàn)檢驗的通過不代表每一個解釋變量是顯著的。對每一個變量的顯著性要看t檢驗統(tǒng)計量的值,t檢驗統(tǒng)計量對應的P值小于0.05(0.01或者0.1也行,具體看情況分析,一般選取0.05)視為是顯著的,從結果可以看出,X6和X7的變量的p是大于0.05的,也就是這兩個變量對被解釋變量的影響是不顯著的要剔除。但是如果你只是關心預測的問題那么可以不剔除。但是如果有研究解釋變量對被解釋變量的影響的程度的,要做進一步的研究。接下來看DW的值,DW的值為1.748,說明模型不存在自相關性。看JB檢驗統(tǒng)計量的值,JB檢驗統(tǒng)計量是對正態(tài)性的假設進行檢驗的,JB的值對應的p值為0.951顯著大于0.05,可以認為模型滿足正態(tài)性的假設的。
3.如何用iPad運行Python代碼?
其實,不只是iPad,手機也可以。痛點我組織過幾次線下編程工作坊,帶著同學們用Python處理數(shù)據(jù)科學問題。其中最讓人頭疼的,就是運行環(huán)境的安裝。實事求是地講,參加工作坊之前,我已經做了認真準備。例如集成環(huán)境,選用了對用戶很友好的Anaconda。代碼在我的Macbook電腦上跑,沒有問題。還拿到學生的Windows 7上跑,也沒有問題。這才上傳到了Github。在發(fā)布的教程文章里,我也已經把安裝軟件包的說明寫得非常詳細。還針對 Anaconda 這一 Python 運行環(huán)境的安裝和運行,專門錄制了視頻。但是,工作坊現(xiàn)場遇見的問題,依然五花八門。有的是操作系統(tǒng)。例如你可能用Windows 10。實話實說,我確實沒用過。拿著Surface端詳,連安裝后的Anaconda文件夾都找不到在哪兒。有的是編碼。不同操作系統(tǒng),有的默認中文編碼是UTF-8,有的是GBK。同樣一段中文文本,我這里顯示一切正常,你那里就是亂碼。有的是套件路徑。來參加工作坊前,你可能看過我一些教程,并安裝了 Python 2.7 版本 Anaconda。來到現(xiàn)場,一看需要 Python 3.6 版本,你就又安裝了一份新的。結果執(zhí)行起來,你根本分不清運行的 Python, pip 命令來自哪一個套件,更搞不清楚軟件包究竟安裝到哪里去了。再加上虛擬環(huán)境配置,你就要抓狂了。還有的,甚至是網絡擁塞問題。因為有時需要現(xiàn)場安裝調用體積龐大的軟件包,幾十臺電腦“預備——齊”一起爭搶有限的Wifi帶寬,后果可想而知。痛定思痛,我決定改變一下現(xiàn)狀。目前的教程只提供基礎源代碼。對于許多新手同學來說,是不夠的。許多同學,就倒在了安裝依賴軟件包的路上,繼而干脆放棄了。變通的辦法有許多。例如干脆錄制代碼執(zhí)行視頻給你看。但是正如我在《MOOC教學,什么最重要?》一文中說過的,學習過程里,反饋最重要。你需要能運行代碼,并且*時間獲得結果反饋。在此基礎上,你還得能修改代碼,對比前后執(zhí)行結果的差別。我得給你提供一個直接可以運行的環(huán)境。零安裝,自然也就沒了上述煩惱。這個事兒可能嗎?我研究了一下,沒問題。只要你的設備上有個現(xiàn)代化瀏覽器(包括但不限于Google Chrome, Firefox, Safari和Microsoft Edge等)就行。IE 8.0?那個不行,趕緊升級吧!讀到這里,你應該想明白了。因為只挑瀏覽器,不挑操作系統(tǒng),所以別說你用Windows 10,你就是用iPad,都能運行代碼。嘗試請你打開瀏覽器,輸入這個鏈接( Jupyter Lab。你可以將它理解為 Jupyter Notebook 的增強版,它具備以下特征:代碼單元直接鼠標拖動;一個瀏覽器標簽,可打開多個Notebook,而且分別使用不同的Kernel;提供實時渲染的Markdown編輯器;完整的文件瀏覽器;CSV數(shù)據(jù)文件快速瀏覽……圖中左側分欄,是工作目錄下的全部文件。右側打開的,是咱們要使用的ipynb文件。為了證明這不是逗你玩兒,請你點擊右側代碼上方工具欄的運行按鈕。點擊一下,就會運行出當前所在代碼單元的結果。不斷點擊下來,你可以看見,結果都被正常渲染。連圖像也能正常顯示。甚至連下面這種需要一定運算量的可視化結果,都沒問題。為了證明這不是變魔術,你可以在新的單元格,寫一行輸出語句。就讓Python輸出你的名字吧。假如你叫 Chuck,就這樣寫:print("Hello, Chuck!") 把它替換成你自己的姓名,看看輸出結果是否正確?其實,又何止是iPad而已?你如果足夠勇(sang) 于(xin) 嘗(bing) 試(kuang),手機其實也是可以的。就像這樣。流程下面我給你講講,這種效果是怎么做出來的。我們需要用到一款工具,叫做 mybinder 。它可以幫助我們,把 github 上的某個代碼倉庫(repo),快速轉換成為一個可運行的環(huán)境。注意 mybinder 為我們提供了云設施,也就是計算資源和存儲資源。因此即便許許多多的用戶同時在線使用同一份代碼轉換出來的環(huán)境,也不會互相沖突。我們先來看看,怎么準備一個可供 mybinder 順利轉換的代碼倉庫。我為你提供的樣例在這里( Embedding)》。感興趣的同學可以點擊鏈接,查看原文。在該 GitHub 頁面展示的文件列表中,你需要注意以下3個文件:demo..其中demo.ipynb就是你在上一節(jié)看到的包含源代碼的Jupyter Notebook文件。你需要首先在本地安裝相關軟件包,并且運行測試通過。如果在你本地運行都有錯誤,放到云上去,想必也難以正常運行。.yml文件非常重要,它來告訴 mybinder ,需要如何為你的代碼運行準備環(huán)境。我們打開看看該文件的內容:: - python=3 - pip: - spacy - ipykernel - scipy - numpy - scikit-learn - - pandas - thinc 這個文件首先告訴 mybinder ,你的 Python 版本。我們采用的是 3.6 版。所以只需要指定 python=3 即可。mybinder 會自動為你下載安裝*的。然后這個文件說明需要使用 pip 工具安裝哪些軟件包。我們需要把所有依賴的安裝包都羅列出來。這就是之前,我總在教程里給你說明的那些準備步驟。但是這還沒有完,因為 mybinder 只是為你安裝好了一些軟件依賴。這里還有兩個步驟需要處理:為了分析語義,我們需要調用預訓練的Word2vec模型,這需要 mybinder 為我們提前下載好。Jupyter Notebook 打開后,應當使用的 kernel 名稱為 wangshuyi ,這個 kernel 目前還沒有在 Jupyter 里面注冊。我們需要 mybinder 代勞。為了完成上述兩個步驟,你就需要準備*一個postBuild文件。它的內容如下:python -m spacy download en python -m spacy download en_core_web_lg python -m ipykernel install --user --name=wangshuyi 跟它的名字一樣。它是在 mybinder 依據(jù) .yml 安裝了依賴組建后,依次執(zhí)行的命令。如果你的代碼需要其他的命令提供環(huán)境支持,也可以放在這里。至此,你的準備工作就算結束了。魔法表演正式開始。請打開 mybinder 的網址( “GitHub repo or URL” 一欄,填寫我們的 github 代碼倉庫鏈接,即: 我們希望一進入界面,就自動打開 demo.ipynb ,因此需要在“Path to a notebook file (optional)”一欄填寫demo.ipynb 。這時,你會發(fā)現(xiàn)“Copy the URL below and share your Binder with others:”一欄中,出現(xiàn)了你的代碼運行環(huán)境網址。 點擊右側的“復制”按鈕保存到你的記事本里面。將來找到你轉換好的運行環(huán)境,就全靠它了。妥善保存地址后,點擊“Launch”按鈕。根據(jù)你的依賴安裝包數(shù)量等因素,你需要等待的時間長短不一。但是只有*次構建的時候,需要花一些時間。以后每一次調用執(zhí)行,就都會非??炝?。構建完畢后, mybinder 會自動為我們開啟對應的運行環(huán)境。很有成就感吧!測試一下,能夠正常運行代碼,就證明我們成功了。但是你會發(fā)現(xiàn),不對??!老師你剛才用 iPad 展示的,不是高級版的 Jupyter Lab 嗎?怎么又變成了 Jupyter Notebook 了?我也想要高級版!別著急??纯茨隳壳暗逆溄拥刂罚?你只需要做個小小的調整,將其中的:?filepath= 替換為:?urlpath=lab/tree/ 替換后的鏈接為: 把它輸入到瀏覽器,看看出來的結果:這下沒問題了吧?原理你是不是覺得,mybinder 很黑科技?其實,也不算。它只是把已有的幾項技術,鏈接了起來。這大概也算是“積木式創(chuàng)新”的一個實例吧。我們看看 mybinder 的說明:可以看到,其中最為關鍵的技術,是用了 docker 。Docker 是個什么東西呢?簡單來說,Docker 就是為了不同平臺上,都能夠順利執(zhí)行同一份代碼的保障工具。你有些猶疑,這說的不是 Java 嗎?沒錯,Java 的宣傳口號,就是一次編碼,各處運行。它利用虛擬機,來保障這種能力。但是,如果你經常使用 Java 開發(fā)出來的工具,就應該了解痛點有哪些了。至少,你應該對 Java 程序的運行速度,有一些體會。上圖中,左側是虛擬機,右側是Docker。Docker 不但效率上要強過 Java 虛擬機,而且它支持的編程語言也不僅僅是一種。至于其他好處,咱們就不展開了。否則聽起來像廣告。其實,把 github 代碼倉庫轉換為 docker 鏡像(image)的工作,也不是 mybinder 自己來做的。它調用的,是另外的一個工具,叫做 ( 。而你的瀏覽器能夠執(zhí)行 Python 代碼,是因為 Jupyter Notebook (或者Lab)本來就是建立在“瀏覽器/服務器”(Browser / Server, B/S)結構上。如果你已經在本地計算機安裝過 Anaconda ,那不妨看看本地執(zhí)行這個語句:jupyter lab 會出現(xiàn)什么?對,它開啟了一個服務器,然后打開你的瀏覽器,跟這個服務器通訊。Jupyter 的這種設計,本身就讓它的擴展極為方便。無論 Jupyter 服務器是運行在你的本地筆記本上,還是擺在另一個大洲的機房,對你執(zhí)行 Python 代碼來說,都是沒有本質區(qū)別的。另外,如果你以為 mybinder 只能讓你在瀏覽器上跑 Python 代碼,那就太小瞧它了。學過 R 的同學,請點擊這個鏈接( mybinder ,把一個 github repo 一鍵轉換成 Jupyter Lab 運行環(huán)境;如何在各種不同操作系統(tǒng)的瀏覽器上,運行該環(huán)境,編寫、執(zhí)行與修改代碼;mybinder 轉換 github repo 的幕后英雄 docker 簡介。我希望你能想到的,不僅僅是這點兒簡單的用途。提幾個問題給你,作為思考題:如果代碼執(zhí)行都在云端完成,教學實驗室機房還有沒有必要預裝一大堆軟件,且不定期更新維護?學校的編程練習、作業(yè)和考試有沒有可能通過這種方式,直接遠程進行,并且自動化評分?既然應用的技術都是開源的,你有沒有可能利用這些開源工具搞個創(chuàng)業(yè)項目。例如提供深度學習環(huán)境,租賃給科研機構與創(chuàng)業(yè)公司?期待你舉一反三,做出有趣又有意義的創(chuàng)新來。討論在 iPad 上運行 Python 代碼的感覺怎么樣?你用過類似的產品嗎?你覺得有了這種技術,在日常工作和學習中,還可以有哪些有趣的應用場景?歡迎留言,把你的經驗和思考分享給大家,我們一起交流討論。如果你對我的文章感興趣,歡迎點贊,并且微信關注和置頂我的公眾號“玉樹芝蘭”()。如果本文可能對你身邊的親友有幫助,也歡迎你把本文通過微博或朋友圈分享給他們。讓他們一起參與到我們的討論中來。延伸閱讀如何高效入門數(shù)據(jù)科學?
4.成功轉行Python工程師,年薪30W+,經驗總結都在這!
這是給轉行做Python的小白的參考,無論是從零開始,或者是轉行的朋友來說,這都是值得一看的,也是可以作為一種借鑒吧。而且我決定轉行IT(互聯(lián)網)行業(yè),其實理由也很簡單,不用動體力,大多數(shù)動的是腦力工作,而且現(xiàn)在的互聯(lián)網趨勢很明顯。再者看到一些網上的招聘平臺,基本上每個行業(yè)都是需要這塊的,工資也都是很高的。于是我便開始了自學之路,當時因為計算機基礎不是很好,可以說特別的困難了,看了一些網上的教程學習,可以說是拆東墻補西墻的做法,甚至有段時間居然想放棄了。不過我加了許多關于數(shù)據(jù)分析的群,認識蠻多朋友,他們都建議我學Python,只有打好這些基礎,才能慢慢循序漸進的學習數(shù)據(jù)分析的內容,于是我便重拾信心,走上這條道。那段時間,我基本上是保持4-6小時的學習,上班有時候不忙也會抽空學習的,晚上一般就對著電腦實操,不懂的話就問那些大佬們。就這樣我就度過了幾個月,不過我掌握了不少技能了,SQL,Python,R。會一點簡單的爬蟲,懂點Linux。如果比起那些專業(yè)大佬來說,我經驗少一些,復雜的算法的話,需要花些時間琢磨。于是懷著新世界的夢想,我辭職了,一家家的面試,雖然有許多公司需要有經驗的,但也是看人來,加上我又是轉行來的,所以碰壁是免不了的,不過我沒有放棄,結果得嘗所愿。我來到了一家互聯(lián)網公司上班,這里的辦公環(huán)境真的很不錯,薪資也比之前在物流公司高些,即使我是轉行新手都有6.5K的底薪,然后加上加班費,餐補、住宿補貼以及其他福利,整體折算下來薪酬都還過得去,而且還是雙休,不得不說,我自己心里也是小開心的??隙ㄓ胁簧偃藛?,零基礎的小白如何學好Python?我自己也打算分享出來,作為一個轉行的人來說,或者是正想轉行的人一些建議,和學習方法吧!既然選擇了數(shù)據(jù)分析的話,就一定要選擇好方向。學習python語言,并能用它來爬取數(shù)據(jù)做數(shù)據(jù)分析;使用python制作一些腳本工具,以幫助并提升工作效率。Python的應用方向,實在太廣了。在Python基礎知識學完之后,如果應用方向不同,要學習的東西也會大不同。我不能說我要做web開發(fā),學完Python基礎知識,跑去學numpy、pandas等知識;也不能說我要用Python做數(shù)據(jù)分析,學完Python基礎知識,然后就跑去學django、flask框架。我學習Python,問了一些專業(yè)的人之后,才慢慢了解到Python在數(shù)據(jù)分析方面,基本涵蓋了“數(shù)據(jù)獲取→數(shù)據(jù)處理→數(shù)據(jù)分析→數(shù)據(jù)可視化”這個流程中每個環(huán)節(jié),都是數(shù)據(jù)分析的利器。所以想學好Python選好方向很重要,而大部分新手對Python的方向并不了解,可能對有些分析也是看都看不懂,我的建議是找了解的人有經驗的人帶你,如果說你交好的朋友中有這部分人是*的,如果沒有耶不用擔心,去找對應的Python交流群就好,我當初就是進入了好幾個Python交流群,不停的問問題,包括學習,包括方向,各種問題都問。 們*在掌握一些業(yè)界廣泛使用的開源框架,比如twisted、peak、django、xml等。通過熟練使用它們,達到閃電開發(fā),大大節(jié)省項目寶貴時間。要學習Python其實不難,難的是堅持和相信自己,我的經驗是既然已經選定Python你就要相信它,相信它能成為你日后進階的高效渠道,這樣自己才會更有信念去學習,才能在碰到困難的時候堅持下去。還有就是不要單打獨斗,要找一群有共同方向的人一起學習,群眾效應的效果是非常強大的,大家一起學習,一起打卡,會更有學習動力,也更能堅持下去。
就拿大數(shù)據(jù)說話,優(yōu)勢一目了然,從事IT行業(yè),打開IT行業(yè)的新大門,找到適合自己的培訓機構,進行專業(yè)和系統(tǒng)的學習。