콘텐츠로 이동

실전 워크플로: 로드 → 전처리 → 분석 → 시각화 → GIS

아래는 HOSSAM을 활용한 대표적인 작업 흐름 예시입니다.

1) 데이터 로드

from hossam import util, data_loader

# 키 목록/설명 확인 (원격 메타데이터)
info = data_loader.load_info()
util.hs_pretty_table(info.head())

# 키로 데이터 로드
df = data_loader.load_data("AD_SALES")

2) 전처리

from hossam import prep

# 카테고리 지정
from pandas import DataFrame
# df["category"] = df["category"].astype("category")  # 혹은 아래 헬퍼 사용
prep.hs_set_category(df, "category")

# 결측치 대체
df2 = prep.hs_replace_missing_value(df.select_dtypes(include="number"), strategy="mean")

# 스케일링(Standard)
scaled = prep.hs_standard_scaler(df, yname="y", save_path="std.pkl")

3) 분석

from hossam import analysis

# 다중공선성 제거(VIF)
filtered = analysis.hs_vif_filter(df, yname="y", ignore=["id"], threshold=10.0)

# 추세선 계산
x = df["x"].to_numpy()
y = df["y"].to_numpy()
vx, vy = analysis.hs_trend(x, y, degree=2)

4) 시각화

from hossam import plot as hs_plot

hs_plot.hs_scatterplot(df=df, xname="x", yname="y", hue="category", palette="Set1")
hs_plot.hs_kdeplot(df=df, xname="x", hue="category", fill=True)

5) GIS

from hossam import gis

# 지오코딩 (VWorld API 키 필요)
result = gis.hs_geocode(df, addr="address", key="YOUR_VWORLD_KEY")

# Shapefile 로드/저장
gdf = gis.hs_load_shape("path/to/file.shp")
gis.hs_save_shape(gdf, "out.gpkg")

참고

  • 더 자세한 API는 사이드바의 "API Reference"에서 모듈별 문서를 참고하세요.
  • 모든 공개 함수 목록은 "API Reference → Index"에서 확인할 수 있습니다.