画像分類の実行（timm のインストールと動作確認）（Python，PyTorch を使用）（Windows 上）

import os
import torch
import timm
import requests
from PIL import Image
from io import BytesIO

# ImageNet 1kのラベル情報をダウンロード
IMAGENET_1k_URL = 'https://storage.googleapis.com/bit_models/ilsvrc2012_wordnet_lemmas.txt'
IMAGENET_1k_LABELS = requests.get(IMAGENET_1k_URL).text.strip().split('\n')

def initialize_model(model_name, pretrained=True):
    model = timm.create_model(model_name, pretrained=pretrained).eval()
    return model

def load_image(path, transform):
    """
    指定されたパス（URLまたはファイル名）から画像を読み込み、モデルの入力形式に変換する関数。
    """
    if path.startswith('http'):
        # URLが指定された場合
        image = Image.open(requests.get(path, stream=True).raw)
    else:
        # ファイル名が指定された場合
        image = Image.open(path)
    
    image_tensor = transform(image)
    return image_tensor

def perform_inference(model, image_tensor, topk=5):
    """
    画像をモデルで分類し、トップkのクラスを返す関数。
    """
    output = model(image_tensor.unsqueeze(0))
    probabilities = torch.nn.functional.softmax(output[0], dim=0)
    values, indices = torch.topk(probabilities, topk)
    return [{'label': IMAGENET_1k_LABELS[idx], 'index': idx, 'value': val.item()} for val, idx in zip(values, indices)]

def main():
    model_name = 'eva02_large_patch14_448.mim_in22k_ft_in1k'
    model = initialize_model(model_name)
    transform = timm.data.create_transform(**timm.data.resolve_data_config(model.pretrained_cfg))

    img_path = 'https://github.com/open-mmlab/mmpretrain/raw/main/demo/demo.JPEG'
    image_tensor = load_image(img_path, transform)

    result = perform_inference(model, image_tensor)
    print("分類結果")
    print(result)

if __name__ == '__main__':
    main()

画像分類の実行（timm のインストールと動作確認）（Python，PyTorch を使用）（Windows 上）

前準備

Git のインストール（Windows 上）

Python のインストール（Windows 上）

Build Tools for Visual Studio 2022，NVIDIA ドライバ，NVIDIA CUDA ツールキット 11.8，NVIDIA cuDNN 8.6 のインストール（Windows 上）

PyTorch のインストール（Windows 上）

timm のインストール，画像分類の実行（Windows 上）