PyTorch

この用語をシェア

概要

PyTorchは、Meta（旧Facebook）が開発したオープンソースの機械学習フレームワークです。動的計算グラフ（Define-by-Run）と直感的なAPIにより、研究開発から本番環境まで幅広く利用されています。特に研究分野での採用率が高く、学術論文での使用頻度も急速に増加しています。

詳細説明

主な特徴

動的計算グラフ：実行時に計算グラフを構築するため、デバッグが容易
Pythonファースト：Pythonの自然な書き方でモデルを定義可能
自動微分：Autograd機能による効率的な勾配計算
GPU加速：CUDA、ROCm、Apple Silicon（MPS）対応
TorchScript：本番環境での最適化とデプロイメント

主要コンポーネント

torch：テンソル操作とニューラルネットワーク構築
torchvision：コンピュータビジョン用のモデルとデータセット
torchaudio：音声処理とオーディオ機械学習
torchtext：自然言語処理用のユーティリティ
TorchServe：本番環境でのモデルサービング

使用例

基本的なニューラルネットワーク

import torch
import torch.nn as nn
import torch.optim as optim

# モデルの定義
class SimpleNet(nn.Module):
    def __init__(self):
        super(SimpleNet, self).__init__()
        self.fc1 = nn.Linear(784, 128)
        self.fc2 = nn.Linear(128, 64)
        self.fc3 = nn.Linear(64, 10)
        self.relu = nn.ReLU()
        
    def forward(self, x):
        x = self.relu(self.fc1(x))
        x = self.relu(self.fc2(x))
        x = self.fc3(x)
        return x

# モデルのインスタンス化
model = SimpleNet()

# 損失関数と最適化手法
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 学習ループ
for epoch in range(10):
    # 前向き伝播
    outputs = model(inputs)
    loss = criterion(outputs, labels)
    
    # 後向き伝播
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()
    
    print(f'Epoch {epoch+1}, Loss: {loss.item():.4f}')

畳み込みニューラルネットワーク

import torch
import torch.nn as nn
import torch.nn.functional as F

class CNN(nn.Module):
    def __init__(self):
        super(CNN, self).__init__()
        self.conv1 = nn.Conv2d(3, 32, 3, padding=1)
        self.conv2 = nn.Conv2d(32, 64, 3, padding=1)
        self.conv3 = nn.Conv2d(64, 128, 3, padding=1)
        self.pool = nn.MaxPool2d(2, 2)
        self.fc1 = nn.Linear(128 * 4 * 4, 512)
        self.fc2 = nn.Linear(512, 10)
        self.dropout = nn.Dropout(0.5)
        
    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = self.pool(F.relu(self.conv3(x)))
        x = x.view(-1, 128 * 4 * 4)
        x = F.relu(self.fc1(x))
        x = self.dropout(x)
        x = self.fc2(x)
        return x

# GPUの使用
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model = CNN().to(device)

適用分野

コンピュータビジョン（画像分類、物体検出、セグメンテーション）
自然言語処理（言語モデル、機械翻訳、質問応答）
生成モデル（GAN、VAE、Diffusionモデル）
強化学習
グラフニューラルネットワーク
医療画像解析

メリット・デメリット

メリット

直感的で読みやすいコード
デバッグが容易な動的計算グラフ
強力な研究コミュニティ
豊富な事前学習済みモデル
柔軟なモデル設計が可能

デメリット

本番環境での最適化が複雑
モバイルデプロイメントが困難
メモリ効率が劣る場合がある
学習が完了するまでモデル構造が確定しない

この用語をシェア

概要

詳細説明

主な特徴

主要コンポーネント

使用例

基本的なニューラルネットワーク

畳み込みニューラルネットワーク

関連技術

適用分野

メリット・デメリット

メリット

デメリット

関連Webサイト

この用語についてもっと詳しく

カテゴリ

関連ページ