hossam.util¶
hossam.util ¶
hs_make_normalize_values ¶
hs_make_normalize_values(mean, std, size=100, round=2)
정규분포를 따르는 데이터를 생성한다.
Parameters:
| Name | Type | Description | Default |
|---|---|---|---|
mean
|
float
|
평균 |
required |
std
|
float
|
표준편차 |
required |
size
|
int
|
데이터 크기. Defaults to 100. |
100
|
round
|
int
|
소수점 반올림 자리수. Defaults to 2. |
2
|
Returns:
| Type | Description |
|---|---|
ndarray
|
np.ndarray: 정규분포를 따르는 데이터 |
Examples:
>>> from hossam.util import hs_make_normalize_values
>>> x = hs_make_normalize_values(mean=0.0, std=1.0, size=100)
>>> x.shape
(100,)
Source code in hossam/util.py
13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 | |
hs_make_normalize_data ¶
hs_make_normalize_data(
means=None, stds=None, sizes=None, rounds=2
)
정규분포를 따르는 데이터프레임을 생성한다.
Parameters:
| Name | Type | Description | Default |
|---|---|---|---|
means
|
list
|
평균 목록. Defaults to [0, 0, 0]. |
None
|
stds
|
list
|
표준편차 목록. Defaults to [1, 1, 1]. |
None
|
sizes
|
list
|
데이터 크기 목록. Defaults to [100, 100, 100]. |
None
|
rounds
|
int
|
반올림 자리수. Defaults to 2. |
2
|
Returns:
| Name | Type | Description |
|---|---|---|
DataFrame |
DataFrame
|
정규분포를 따르는 데이터프레임 |
Source code in hossam/util.py
46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 | |
hs_pretty_table ¶
hs_pretty_table(data, tablefmt='simple', headers='keys')
tabulate를 사용해 DataFrame을 단순 표 형태로 출력한다.
Parameters:
| Name | Type | Description | Default |
|---|---|---|---|
data
|
DataFrame
|
출력할 데이터프레임 |
required |
tablefmt
|
str
|
|
'simple'
|
headers
|
str | list
|
헤더 지정 방식. Defaults to "keys". |
'keys'
|
Returns:
| Type | Description |
|---|---|
None
|
None |
Examples:
>>> from hossam.util import hs_pretty_table
>>> from pandas import DataFrame
>>> hs_pretty_table(DataFrame({"a":[1,2],"b":[3,4]}))
Source code in hossam/util.py
80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 | |
hs_load_data ¶
hs_load_data(
key,
index_col=None,
timeindex=False,
info=True,
categories=None,
local=None,
)
데이터 키를 통해 데이터를 로드한 뒤 기본 전처리/출력을 수행한다.
Parameters:
| Name | Type | Description | Default |
|---|---|---|---|
key
|
str
|
데이터 키 (metadata.json에 정의된 데이터 식별자) |
required |
index_col
|
str
|
인덱스로 설정할 컬럼명. Defaults to None. |
None
|
timeindex
|
bool
|
True일 경우 인덱스를 시계열(DatetimeIndex)로 설정한다. Defaults to False. |
False
|
info
|
bool
|
True일 경우 데이터 정보(head, tail, 기술통계, 카테고리 정보)를 출력한다. Defaults to True. |
True
|
categories
|
list
|
카테고리 dtype으로 설정할 컬럼명 목록. Defaults to None. |
None
|
local
|
str
|
원격 데이터 대신 로컬 메타데이터 경로를 사용한다. Defaults to None. |
None
|
Returns:
| Name | Type | Description |
|---|---|---|
DataFrame |
DataFrame
|
전처리(인덱스 설정, 카테고리 변환)가 완료된 데이터프레임 |
Examples:
>>> from hossam.util import hs_load_data
>>> df = hs_load_data("AD_SALES", index_col=None, timeindex=False, info=False)
>>> isinstance(df.columns, object)
True
Source code in hossam/util.py
165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 | |