본문 바로가기

인공지능/데이터분석27

슈퍼스토어 마켓팅 캠페인 데이터셋 - Cluster,K-Means https://www.kaggle.com/datasets/ahsan81/superstore-marketing-campaign-dataset Superstore Marketing Campaign DatasetSample customer data for analysis of a targeted Membership Offerwww.kaggle.com1. 슈퍼스토어 마켓팅 캠페인 데이터셋슈퍼스토어 마켓팅 캠페인 데이터셋 은 Superstore 마케팅 캠페인 데이터를 포함하고 있으며, 고객의 인구통계학적 정보(예: 출생 연도, 학력, 결혼 상태, 소득), 가구 구성(어린이와 십대 자녀 수), 구매 기록(와인, 육류, 생선 등 다양한 제품군에 대한 지출), 구매 채널(매장, 웹사이트, 카탈로그), 그리고 고객의 마.. 2025. 2. 14.
호텔 예약 수요 데이터셋 1. 호텔 예약 수요 데이터셋데이터셋은 일반적으로 호텔 예약에 대한 수요 패턴을 분석하기 위한 데이터셋입니다. 이 데이터셋은 예약 취소, 체크인 날짜, 고객 유형, 체류 기간, 객실 유형, 예약 경로 등 다양한 요소를 포함하며, 주로 예약 트렌드 분석, 고객 행동 예측, 수요 예측 등에 사용됩니다.https://www.kaggle.com/datasets/jessemostipak/hotel-booking-demand Hotel booking demandFrom the paper: hotel booking demand datasetswww.kaggle.com 2. 데이터셋 컬럼 설명hotel: 호텔 유형 (Resort Hotel, City Hotel)is_canceled: 예약 취소 여부 (0: 예약 유지,.. 2025. 2. 2.
서울 자전거 공유 수요 예측 데이터셋 서울 자전거 공유 수요 데이터셋서울시의 공공자전거 대여 서비스인 ‘따릉이’의 대여 수요를 예측하는 문제에 사용되는 데이터셋입니다. 특정 시간대와 날씨, 요일, 공휴일 여부, 기온, 습도 등 다양한 데이터를 활용하여 자전거 대여 수요를 예측합니다.https://www.kaggle.com/datasets/joebeachcapital/seoul-bike-sharing/data Seoul Bike Sharing Demand PredictionPredict demand for shared bikes in Seoul based on various environmental factorswww.kaggle.com 데이터셋 컬럼Date : 연월일Rented Bike count - 매 시간마다 대여한 자전거 수Hour -.. 2025. 2. 1.
주택 임대료 예측 데이터셋 1. 주택 임대료 예측 데이터셋House Rent Prediction Dataset은 주택 임대료를 예측하기 위한 목적으로 사용되는 데이터셋입니다. 이 데이터셋은 주로 머신러닝 및 데이터 분석 프로젝트에서 사용되며, 주택의 다양한 특성과 위치 정보를 기반으로 임대료를 예측하는 모델을 학습하는 데 활용됩니다.https://www.kaggle.com/datasets/iamsouravbanerjee/house-rent-prediction-dataset/data?select=House_Rent_Dataset.csv House Rent Prediction DatasetRenting Insights: House Rent Prediction Dataset with 4700+ Listingswww.kaggle.com2.. 2025. 1. 31.
사이킷런-아이리스(Iris) 데이터셋 분석 1. 사이킷런사이킷런(scikit-learn)은 파이썬(Python)으로 작성된 오픈소스 머신러닝 라이브러리로, 데이터 분석과 예측 모델 구축을 위해 널리 사용됩니다. 간단하고 일관된 인터페이스를 제공하며, 지도 학습(Supervised Learning)과 비지도 학습(Unsupervised Learning) 알고리즘을 모두 지원합니다. 주로 분류(Classification), 회귀(Regression), 클러스터링(Clustering), 차원 축소(Dimensionality Reduction), 모델 선택(Model Selection), 전처리(Preprocessing)와 같은 다양한 작업을 수행할 수 있습니다. 사이킷런은 효율적인 수치 계산이 가능하며, 다양한 머신러닝 알고리즘을 손쉽게 사용할 수 있.. 2025. 1. 31.
텐서(Tensor) 텐서 PyTorch의 텐서(Tensor)는 딥러닝 모델에서 데이터를 다룰 때 사용되는 기본 데이터 구조입니다. 텐서는 다차원 배열로, NumPy의 배열과 비슷하지만, GPU에서 연산을 수행할 수 있다는 점에서 차이가 있습니다. PyTorch의 텐서는 데이터의 표현뿐만 아니라, 자동 미분(autograd) 기능을 제공하여 딥러닝 모델의 학습을 도와줍니다. 1. 2D 텐서 생성data = [ [1, 2], [3, 4]]t1 = torch.tensor(data)print(t1) # 출력: tensor([[1, 2], [3, 4]])torch.tensor(data):2D 리스트(data)를 PyTorch의 2차원 텐서로 변환.t1의 값:[[1, 2], [3, 4]]2. 텐서 연산 후 NumPy 변환t1 =.. 2025. 1. 29.