개요
- 이번 테스크에서는 Sepectrogram이 무엇인지 알 수 있다.
- Sepectrogram의 이미지가 입력값으로 주어진다. 오디오가 있을 때마다 파일 또는 오디오 신호를 Sepectrogram을 사용하여 나타낸다.
- 이론적인 부분에서, Covolutional Neural Network의 작동과 Covolutional Neural Network가 무엇인지 분명히 한다.
- Optimization이 어떻게 작동하는지, Gradient decent나 adam과 같은 최적화 유형을 알아야 한다.
- Python 프로그래밍과 PyTorch의 기본기가 명확해야 한다.
Imports
Installing collected packages: huggingface-hub, timm
Successfully installed huggingface-hub-0.12.1 timm-0.6.12
1
2
3
4
5
6
7
8
9
10
11
| import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import torch
from torch import nn, optim
from torch.utils.data import Dataset, DataLoader
from torchvision import transforms as T
import timm
|
Configurations
1
2
3
4
5
6
7
8
9
10
| TRAIN_CSV = 'train.csv'
VALID_CSV = 'valid.csv'
BATCH_SIZE = 128
DEVICE = 'cuda'
MODEL_NAME = 'efficientnet_b0'
LR = 0.001
EPOCHS = 15
|
- 각 컬럼은 스펙트로그램 이미지의 각 픽셀 값을 나타낸다.
- 스펙트로그램 이미지를 1차원 벡터로 convert 할 것이다.
1
2
3
4
| df_train = pd.read_csv(TRAIN_CSV)
df_valid = pd.read_csv(VALID_CSV)
df_train.head()
|
| 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | ... | 8183 | 8184 | 8185 | 8186 | 8187 | 8188 | 8189 | 8190 | 8191 | labels |
---|
0 | 0.631373 | 0.623529 | 0.713726 | 0.705882 | 0.658824 | 0.666667 | 0.654902 | 0.635294 | 0.647059 | 0.705882 | ... | 0.611765 | 0.650980 | 0.658824 | 0.600000 | 0.603922 | 0.654902 | 0.694118 | 0.658824 | 0.666667 | Squiggle |
---|
1 | 0.725490 | 0.752941 | 0.749020 | 0.701961 | 0.690196 | 0.721569 | 0.709804 | 0.745098 | 0.654902 | 0.721569 | ... | 0.698039 | 0.721569 | 0.686275 | 0.713726 | 0.682353 | 0.690196 | 0.698039 | 0.701961 | 0.725490 | Squiggle |
---|
2 | 0.717647 | 0.701961 | 0.713726 | 0.733333 | 0.705882 | 0.717647 | 0.725490 | 0.682353 | 0.717647 | 0.674510 | ... | 0.694118 | 0.705882 | 0.682353 | 0.639216 | 0.713726 | 0.670588 | 0.678431 | 0.737255 | 0.674510 | Squiggle |
---|
3 | 0.705882 | 0.674510 | 0.654902 | 0.678431 | 0.666667 | 0.662745 | 0.678431 | 0.662745 | 0.686275 | 0.686275 | ... | 0.662745 | 0.631373 | 0.643137 | 0.705882 | 0.662745 | 0.705882 | 0.666667 | 0.654902 | 0.631373 | Squiggle |
---|
4 | 0.647059 | 0.729412 | 0.701961 | 0.674510 | 0.611765 | 0.698039 | 0.713726 | 0.662745 | 0.701961 | 0.674510 | ... | 0.670588 | 0.705882 | 0.674510 | 0.721569 | 0.694118 | 0.674510 | 0.705882 | 0.749020 | 0.729412 | Squiggle |
---|
5 rows × 8193 columns