본문 바로가기

인공지능/데이터분석29

호텔 예약 수요 데이터셋 1. 호텔 예약 수요 데이터셋데이터셋은 일반적으로 호텔 예약에 대한 수요 패턴을 분석하기 위한 데이터셋입니다. 이 데이터셋은 예약 취소, 체크인 날짜, 고객 유형, 체류 기간, 객실 유형, 예약 경로 등 다양한 요소를 포함하며, 주로 예약 트렌드 분석, 고객 행동 예측, 수요 예측 등에 사용됩니다.https://www.kaggle.com/datasets/jessemostipak/hotel-booking-demand Hotel booking demandFrom the paper: hotel booking demand datasetswww.kaggle.com 2. 데이터셋 컬럼 설명hotel: 호텔 유형 (Resort Hotel, City Hotel)is_canceled: 예약 취소 여부 (0: 예약 유지,.. 2025. 2. 2.
파이토치로 구현한 논리 회귀 1. 논리 회귀논리 회귀(Logistic Regression)는 주어진 입력 데이터를 기반으로 두 가지 이상의 범주로 분류하는 지도 학습 알고리즘입니다. 주로 이진 분류 문제에 사용되며, 입력 변수의 선형 결합을 통해 특정 사건이 발생할 확률을 예측합니다. 이 알고리즘은 시그모이드(Sigmoid) 함수 또는 로지스틱 함수라는 비선형 함수를 사용하여 예측값을 0과 1 사이의 확률로 변환합니다. 모델의 결과는 일반적으로 특정 임계값(예: 0.5)을 기준으로 두 범주 중 하나로 분류됩니다. 예를 들어, 이메일이 스팸인지 아닌지를 판별하거나 환자의 병 진단 여부를 예측하는 데 사용될 수 있습니다. 논리 회귀는 계산이 비교적 간단하고 해석이 용이하여 머신러닝에서 널리 사용되는 알고리즘입니다. ※ 시그모이드 함수시.. 2025. 2. 1.
서울 자전거 공유 수요 예측 데이터셋 서울 자전거 공유 수요 데이터셋서울시의 공공자전거 대여 서비스인 ‘따릉이’의 대여 수요를 예측하는 문제에 사용되는 데이터셋입니다. 특정 시간대와 날씨, 요일, 공휴일 여부, 기온, 습도 등 다양한 데이터를 활용하여 자전거 대여 수요를 예측합니다.https://www.kaggle.com/datasets/joebeachcapital/seoul-bike-sharing/data Seoul Bike Sharing Demand PredictionPredict demand for shared bikes in Seoul based on various environmental factorswww.kaggle.com 데이터셋 컬럼Date : 연월일Rented Bike count - 매 시간마다 대여한 자전거 수Hour -.. 2025. 2. 1.
주택 임대료 예측 데이터셋 1. 주택 임대료 예측 데이터셋House Rent Prediction Dataset은 주택 임대료를 예측하기 위한 목적으로 사용되는 데이터셋입니다. 이 데이터셋은 주로 머신러닝 및 데이터 분석 프로젝트에서 사용되며, 주택의 다양한 특성과 위치 정보를 기반으로 임대료를 예측하는 모델을 학습하는 데 활용됩니다.https://www.kaggle.com/datasets/iamsouravbanerjee/house-rent-prediction-dataset/data?select=House_Rent_Dataset.csv House Rent Prediction DatasetRenting Insights: House Rent Prediction Dataset with 4700+ Listingswww.kaggle.com2.. 2025. 1. 31.
사이킷런-아이리스(Iris) 데이터셋 분석 1. 사이킷런사이킷런(scikit-learn)은 파이썬(Python)으로 작성된 오픈소스 머신러닝 라이브러리로, 데이터 분석과 예측 모델 구축을 위해 널리 사용됩니다. 간단하고 일관된 인터페이스를 제공하며, 지도 학습(Supervised Learning)과 비지도 학습(Unsupervised Learning) 알고리즘을 모두 지원합니다. 주로 분류(Classification), 회귀(Regression), 클러스터링(Clustering), 차원 축소(Dimensionality Reduction), 모델 선택(Model Selection), 전처리(Preprocessing)와 같은 다양한 작업을 수행할 수 있습니다. 사이킷런은 효율적인 수치 계산이 가능하며, 다양한 머신러닝 알고리즘을 손쉽게 사용할 수 있.. 2025. 1. 31.
파이토치로 구현한 선형 회귀 선형회귀란?선형회귀(Linear Regression)는 독립변수 X와 종속변수 Y 사이의 선형 관계를 모델링하는 가장 기본적인 머신러닝 알고리즘 중 하나입니다. 일반적으로 아래의 수식으로 표현됩니다.여기서:W: 가중치(Weight)b: 편향(Bias)x: 입력 값PyTorch를 사용해 단순 선형회귀와 다중 선형회귀를 구현해보겠습니다.1. 선형 회귀 분석선형 회귀 분석(Linear Regression)은 주어진 데이터에서 입력 변수(독립 변수)와 출력 변수(종속 변수) 사이의 관계를 직선(또는 다차원에서는 평면)으로 설명하고, 새로운 입력 값에 대한 출력을 예측하는 통계 및 머신러닝 기법입니다. 예를 들어, 공부 시간(입력 변수)과 시험 점수(출력 변수) 사이의 관계를 분석해 "공부 시간이 늘어날수록 시험.. 2025. 1. 29.