happy_things

情報発信及び日常ブログ

python - csvファイル列行の完全一致、部分一致コード

(コード整理)

 

使用したCSVファイルの内容

python_sample.csv

name age city score
james 17 NY 50
robert 17 CA 20
john 18 CA 40
william 19 NY 70
thomas 20 NY 90

 

CSVファイル読み込み

import pandas as pd

df = pd.read_csv('data/python_sample.csv')
print(df)

#### 결과 표시

 

完全一致

'==' を入れると完全一致で True/False 表示が可能

df['列(column)名'] == '(探したい文字)'

 

**コードの書き方はprintを使うことも、df定義で書く方法も両方可能です。

city列に答えがNYの行を導出する方法。

##### 1
print(df['city'] == 'NY')
#0   True
#1   False
#2   False
#3   Tru)
#4   True

##### 2
df = df['city'] == 'NY'
df

## (同じ結果表示)

 

部分一致

「name」列に「j」が入った行を確認してみましょう。

print(df['name'].str.contains('j'))
#0  True
#1  False
#2  True
#3  False
#4  False

 

コードの前にdateframe 'df'を入れると結果として全体の表が導出。

条件に真と一致した行のみを結果として表示します。

print(df[df['name'].str.contains('j')])
    name    age   city   score
#0  james   17    NY     50
#1  john    18    CA     40