-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy pathpreprocessing.py
More file actions
42 lines (30 loc) · 1.23 KB
/
preprocessing.py
File metadata and controls
42 lines (30 loc) · 1.23 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
import os
import pandas as pd
from config.paths import PATH_PREPROCESSED_DATA
from config.paths import PATH_RAW_DATA
from utils.data import prepare
from utils.data import preprocess
from utils.explorer import explorer
def main():
"""
Тока входа предварительной обработки данных;
:return: None.
"""
names = explorer(PATH_RAW_DATA, exclude=('checkpoints', ))
os.system('cls')
print('Список необработанных данных:', names, sep='\n', flush=True)
if name := input('Выберите данные: '):
games = pd.read_csv(f'{PATH_RAW_DATA}/{name}/games.csv')
genres = pd.read_csv(f'{PATH_RAW_DATA}/{name}/genres.csv')
# Подготовка к предварительно обработке данных.
data = prepare(games, genres)
# Предварительная обработка данных.
data['description'] = preprocess(data['description'])
# Сохранение предобработанных данных.
data.to_csv(
path_or_buf=fr'{PATH_PREPROCESSED_DATA}\{name}.csv',
sep=',',
index=False
)
if __name__ == '__main__':
main()