【Seabornの魅力】統計グラフを簡単に作成する方法とサンプルコードを徹底解説!

※関数の書き方・実行結果に誤りがあるケースがあります。随時修正中です。また誤りに気づかれた方はこちらからご連絡頂きますとめちゃ嬉しいです。

目次

Seabornの導入文

おおきに!今日はPythonのライブラリ「Seaborn」についてお話しするで。Seabornはデータを視覚化するためのツールなんやけど、これを使うと統計グラフを簡単に作れるんや!これがどんなに便利かって言うたら、例えば、数字だけのデータをグラフにすることで、見た目でパッとわかりやすくなるんや。

想像してみてや。学校の友達と「どのアイスが一番人気か?」を調べたとするやろ。その結果を数字だけで並べるより、グラフにした方がみんなに伝わりやすいし、話も盛り上がるやん!Seabornを使えば、そのグラフ作成がめっちゃ簡単になるんやで。

さあ、これからSeabornの魅力を一緒に探っていこうや!

① Seabornの特徴と利点

Seabornは、Pythonのデータ可視化ライブラリの一つで、特に統計データを扱うのに適してるんや。特徴と利点について、詳しゅう説明するで!

美しいデフォルトスタイル
Seabornは、デフォルトのスタイルがめっちゃおしゃれで、簡単に見栄えのええグラフが作れるんや。特別な設定せんでも、きれいなグラフがパッと出てくるで!

統計的な可視化
統計データに特化してるから、ヒストグラムや箱ひげ図、回帰分析など、統計的な視覚化が得意や。これらの図はデータの分布や傾向を簡単に理解するのに役立つんや。

データフレームとの親和性
SeabornはPandasのデータフレームとスムーズに連携できるから、データ処理の後にそのまま視覚化できるんや。データを整理した後、すぐにグラフが作れるのはほんまに便利やで。

多様なグラフタイプ
ヒストグラムや箱ひげ図だけでなく、回帰プロットや相関プロット、カテゴリデータの可視化など、さまざまなグラフが作れるのが魅力や。これでデータの違った側面を見れるようになるんや。

カスタマイズの柔軟性
Seabornはカスタマイズもできるから、自分好みのスタイルや色合いに調整することが可能や。グラフを見た人にインパクトを与えたいなら、カスタマイズするのもええアイデアやで。

これらの特徴を活かして、Seabornを使うことでデータの可視化がグッと楽になるんや。次は、実際にヒストグラムや箱ひげ図を作ってみようか!

② ヒストグラム、箱ひげ図の作成

さて、次はSeabornを使ってヒストグラムと箱ひげ図を作ってみるで!これらのグラフはデータの分布や傾向を視覚的に理解するのにめっちゃ役立つんや。さっそくコードを見てみよう!

ヒストグラムの作成

ヒストグラムはデータの分布を示すためのグラフや。特に連続データの分布を把握するのに便利やで。以下のコードを使って、ヒストグラムを作ってみよう。

import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np

# ランダムなデータを生成
data = np.random.randn(1000)

# ヒストグラムを作成
sns.histplot(data, bins=30, kde=True)
plt.title('ヒストグラムの例')
plt.xlabel('値')
plt.ylabel('頻度')
plt.show()

このコードを実行したら、ヒストグラムが表示されるはずや。kde=Trueにすると、密度推定の曲線も一緒に表示されるで。

箱ひげ図の作成

次に、箱ひげ図を作ってみるで。箱ひげ図はデータの分布の要約を示すグラフで、中央値や四分位数、外れ値がわかりやすく表現されるんや。以下のコードを使って、箱ひげ図を作成してみよう。

# ランダムなデータを生成
data = np.random.randn(100)

# 箱ひげ図を作成
sns.boxplot(data=data)
plt.title('箱ひげ図の例')
plt.ylabel('値')
plt.show()

このコードを実行すると、箱ひげ図が表示されるで。データのばらつきや外れ値が一目でわかるから、データの理解が深まるんや。

これでヒストグラムと箱ひげ図の作成ができたな!次は、回帰プロットと相関プロットについて学んでいこうか!

③ 回帰プロットと相関プロット

次は、Seabornを使って回帰プロットと相関プロットを作成してみよう!これらのプロットは、データの関係性を視覚化するのにとても便利なんや。さっそくコードを見ていこう!

回帰プロットの作成

回帰プロットは、2つの変数間の関係を視覚化するためのグラフや。特に線形回帰を使って、どれくらい関係があるかを示すことができるんや。以下のコードで回帰プロットを作ってみよう。

# ランダムなデータを生成
import pandas as pd

x = np.random.rand(100)
y = 2 * x + np.random.normal(0, 0.1, 100)

# データフレームの作成
data = pd.DataFrame({'x': x, 'y': y})

# 回帰プロットを作成
sns.regplot(x='x', y='y', data=data)
plt.title('回帰プロットの例')
plt.xlabel('Xの値')
plt.ylabel('Yの値')
plt.show()

このコードを実行すると、回帰線が描かれた散布図が表示されるで。これでXとYの関係がどんな感じか、パッとわかるようになるんや。

相関プロットの作成

次は相関プロットや!相関プロットは、複数の変数同士の相関関係を視覚化するのに役立つんや。特に、相関行列を使ったヒートマップで見ることができるで。以下のコードを使って、相関プロットを作成してみよう。

# ランダムなデータを生成
data = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])

# 相関行列を作成
correlation_matrix = data.corr()

# ヒートマップを作成
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm')
plt.title('相関プロットの例')
plt.show()

このコードを実行したら、相関係数が表示されたヒートマップが出てくるで。色の濃さで相関の強さがわかるから、どの変数がどれだけ関係してるかが一目でわかるんや。

これで回帰プロットと相関プロットの作成ができたな!次は、カテゴリデータの可視化について学んでいこうか!

④ カテゴリデータの可視化

さて、次はカテゴリデータの可視化について学んでいくで!Seabornを使うと、カテゴリデータを簡単に視覚化できるんや。カテゴリデータは、特定のグループやクラスに分けられるデータのことや。ここでは、棒グラフやピボットテーブルを使った可視化を見ていこう!

棒グラフの作成

まずは、棒グラフを作成してみるで。棒グラフは、カテゴリごとの値を視覚的に比較するのに適してるんや。以下のコードを使って、棒グラフを作成してみよう。

# サンプルデータを作成
data = pd.DataFrame({
    'カテゴリ': ['A', 'B', 'C', 'D'],
    '値': [4, 7, 1, 8]
})

# 棒グラフを作成
sns.barplot(x='カテゴリ', y='値', data=data)
plt.title('カテゴリデータの棒グラフ')
plt.xlabel('カテゴリ')
plt.ylabel('値')
plt.show()

このコードを実行すると、カテゴリごとの値を示す棒グラフが表示されるで。どのカテゴリがどれだけの値を持っているか、すぐにわかるようになるんや。

箱ひげ図を用いたカテゴリデータの可視化

次は、箱ひげ図を使ってカテゴリデータを視覚化してみよう。箱ひげ図は、データの分布をカテゴリごとに比較するのに便利や。以下のコードを使って、箱ひげ図を作成してみよう。

# サンプルデータを作成
data = pd.DataFrame({
    'カテゴリ': ['A', 'A', 'B', 'B', 'C', 'C', 'D', 'D'],
    '値': [4, 5, 7, 8, 1, 3, 8, 6]
})

# 箱ひげ図を作成
sns.boxplot(x='カテゴリ', y='値', data=data)
plt.title('カテゴリデータの箱ひげ図')
plt.xlabel('カテゴリ')
plt.ylabel('値')
plt.show()

このコードを実行したら、カテゴリごとの値の分布を示した箱ひげ図が表示されるで。中央値や四分位数、外れ値が一目でわかるから、カテゴリ間の比較が簡単になるんや。

これでカテゴリデータの可視化の方法がわかったな!次は、Seabornのスタイル設定について学んでいこうか!

⑤ Seabornのスタイル設定

最後に、Seabornのスタイル設定について学んでいこう!グラフの見た目をカスタマイズすることで、より魅力的でわかりやすいビジュアルを作成できるんや。Seabornには、いくつかのスタイルが用意されているから、それを使ってグラフをおしゃれにしてみよう!

スタイルの設定

まずは、Seabornのスタイルを設定してみるで。set_style()を使うことで、グラフの背景や軸のデザインを変更できるんや。以下のコードを見てみよう。

# Seabornのスタイルを設定
sns.set_style('whitegrid')

# サンプルデータを作成
data = pd.DataFrame({
    'カテゴリ': ['A', 'B', 'C', 'D'],
    '値': [4, 7, 1, 8]
})

# 棒グラフを作成
sns.barplot(x='カテゴリ', y='値', data=data)
plt.title('スタイル設定した棒グラフ')
plt.xlabel('カテゴリ')
plt.ylabel('値')
plt.show()

このコードを実行したら、白いグリッド線の入ったスタイルの棒グラフが表示されるで。set_style()には、他にもdarkgridtickswhiteなどのスタイルが選べるから、いろいろ試してみてな!

カラーパレットの設定

次に、カラーパレットを設定してみよう。set_palette()を使うことで、グラフの色を変更できるんや。以下のコードを使って、カラーパレットを変更してみよう。

# カラーパレットを設定
sns.set_palette('pastel')

# サンプルデータを作成
data = pd.DataFrame({
    'カテゴリ': ['A', 'B', 'C', 'D'],
    '値': [4, 7, 1, 8]
})

# 棒グラフを作成
sns.barplot(x='カテゴリ', y='値', data=data)
plt.title('カラーパレット設定した棒グラフ')
plt.xlabel('カテゴリ')
plt.ylabel('値')
plt.show()

このコードを実行したら、パステルカラーの棒グラフが表示されるで。カラーパレットには、deepmutedbrightなど、いろんなオプションがあるから、自分の好みに合わせて選んでみてな!

フォントサイズやスタイルの調整

さらに、フォントサイズやスタイルも調整できるで。plt.title(), plt.xlabel(), plt.ylabel()の中で、フォントサイズを指定してみよう。

# サンプルデータを作成
data = pd.DataFrame({
    'カテゴリ': ['A', 'B', 'C', 'D'],
    '値': [4, 7, 1, 8]
})

# 棒グラフを作成
sns.barplot(x='カテゴリ', y='値', data=data)
plt.title('フォントサイズを調整した棒グラフ', fontsize=16)
plt.xlabel('カテゴリ', fontsize=14)
plt.ylabel('値', fontsize=14)
plt.show()

このコードを実行したら、フォントサイズが調整された棒グラフが表示されるで!視覚的にわかりやすくなるから、ぜひ試してみてな。

これでSeabornのスタイル設定についての学習が終わったで!グラフを見やすく、魅力的にするために、いろんなスタイルやカラーパレットを試して、データの可視化を楽しんでな!これからもPythonとSeabornを使って、データ分析を進めていこう!

【Seabornの魅力】統計グラフを簡単に作成する方法とサンプルコードを徹底解説!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

目次