主頁 > 知識庫 > pandas數(shù)據(jù)處理之 標(biāo)簽列字符轉(zhuǎn)數(shù)字的實現(xiàn)

pandas數(shù)據(jù)處理之 標(biāo)簽列字符轉(zhuǎn)數(shù)字的實現(xiàn)

熱門標(biāo)簽:ai地圖標(biāo)注 n400電話申請多少錢 如何在地圖標(biāo)注文字 女王谷地圖標(biāo)注 廈門crm外呼系統(tǒng)如何 地圖標(biāo)注推廣單頁 長春人工智能電銷機(jī)器人官網(wǎng) 西藏快速地圖標(biāo)注地點 百應(yīng)ai電銷機(jī)器人鄭州

機(jī)器學(xué)習(xí)中,當(dāng)我們在進(jìn)行數(shù)據(jù)預(yù)處理的時候,對于標(biāo)簽列非字符的數(shù)據(jù),我們往往需要將其轉(zhuǎn)換成字符,因為有的算法可能不支持非數(shù)字類型來做特征。

那么怎么快捷地來著這個轉(zhuǎn)換呢,請看我的示例:

1.構(gòu)建測試數(shù)據(jù)

import pandas as pd
array = ['good','bad','well','bad','good','good','well','good']

2.數(shù)據(jù)轉(zhuǎn)換下,并獲取標(biāo)簽列的字典

df = pd.DataFrame(array,columns=['status'])
status_dict = df['status'].unique().tolist()

3.使用函數(shù)進(jìn)行轉(zhuǎn)換

df['transfromed']=df['status'].apply(lambda x : status_dict.index(x))

這樣,就將標(biāo)簽列處理好了哈

等用完之后,再轉(zhuǎn)回來

df['transfromed1']= df['transfromed'].apply(lambda x : status_dict[x])

補充:pandas factorize將字符串特征轉(zhuǎn)化為數(shù)字特征

將原始數(shù)據(jù)中的字符串特征轉(zhuǎn)化為模型可以識別的數(shù)字特征可是使用pandas自帶的factorzie方法。

原始數(shù)據(jù)的job特征值如下

都是字符串特征,無法用于訓(xùn)練,當(dāng)然可以單獨建立map硬編碼處理,但是pandas已經(jīng)封裝好了相應(yīng)的方法。

data = pd.read_csv("data/test_set.csv")
data["job"] = pd.factorize(data["job"])[0].astype(np.uint16)

以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。

您可能感興趣的文章:
  • pandas 對每一列數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化的方法
  • pandas數(shù)據(jù)處理進(jìn)階詳解
  • Pandas 數(shù)據(jù)處理,數(shù)據(jù)清洗詳解
  • 使用pandas模塊實現(xiàn)數(shù)據(jù)的標(biāo)準(zhǔn)化操作

標(biāo)簽:內(nèi)江 拉薩 興安盟 廊坊 亳州 綿陽 黔東 渭南

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《pandas數(shù)據(jù)處理之 標(biāo)簽列字符轉(zhuǎn)數(shù)字的實現(xiàn)》,本文關(guān)鍵詞  pandas,數(shù)據(jù)處理,之,標(biāo)簽,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《pandas數(shù)據(jù)處理之 標(biāo)簽列字符轉(zhuǎn)數(shù)字的實現(xiàn)》相關(guān)的同類信息!
  • 本頁收集關(guān)于pandas數(shù)據(jù)處理之 標(biāo)簽列字符轉(zhuǎn)數(shù)字的實現(xiàn)的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章