분류 전체보기 22

[혼공학습단 10기] 혼자 공부하는 R 데이터 분석 Chapter 05

Chapter 05 데이터 가공하기 05-1 dplyr 패키지 dplyr 패키지 plyr 패키지 + C++언어 : 사용자 친화적으로 빠르게 데이터 프레임을 조작할 수 있는 패키지 dplyr 패키지 설치 및 로드하기 # dplyr 패키지 설치 및 로드하기 install.packages(“dplyr”) library(dplyr) 데이터 추출 및 정렬하기 ® 행 추출하기 : filter() 함수 filter(“원시 데이터”, 조건) ® 열 추출하기 : select() 함수 select(“원시 데이터”, 조건) ® 정렬하기 : arrange() 함수 arrange(“원시 데이터”, 조건) 데이터 추가 및 중복 데이터 제거하기 ® 열 추가하기 : mutate() 함수 mutate(“원시 데이터”, 추가할 변수 이..

(코드 오류와 해결 기록) dcast() : Aggregation function missing: defaulting to length

혼공R이 p254 풀던 중 예시와 달리 앞 챕터에서 만든 데이터프레임을 dcast() 함수에 집어넣었더니 Aggregation function missing: defaulting to length 이런 오류가 나왔다 (티스토리는 이게 오류 코드인지 그냥 코드인지는 인식 못하고 그냥 글자대로만 인식하는 걸까?) chat GPT한테도 물어봤는데 표면적으로만 해결하고 본질적인 문제는 해결하지 못해서 결국 추가적으로 공부를 하게 되었다. 오류의 원인을 알기 위해서는 (1) aggregation 함수, (2) length 함수, (3) "wind"와 "day"의 차이를 알아야하고 또 코드를 조금씩 바꿔서 실행해본 결과를 비교해서 오류를 해결할 수 있다. 오류의 원인 : 기본 지식 (1) aggregation() ..

[혼공학습단 10기] 혼자 공부하는 R 데이터분석 Chapter 04

Chapter 04 데이터 다루기 04-1 데이터 수집하기 데이터 수집 데이터 수집 : 분석할 데이터를 준비하는 과정 데이터 원천 설명 직접 입력 벡터나 데이터 프레임을 R에 함수로 입력하는 방법 외부 데이터 가져오기 *.txt, *.csv, *.xlsx 직접 입력 # 데이터 입력 : 벡터 만들기, 데이터 프레임 만들기와 동일 변수명 stem(z, scale=2) > stem(z, scale=3) #결과가 같음 1 | 0 2 | 0 3 | 0 4 | 0 5 | 0 6 | 0 7 | 0 8 | 00 9 | 00 >stem(z, scale=0.5) >stem(z, scale=0.8) #결과가 같음 0 | 1234 0 | 5678899 산점도 plot(x, y) -- plot(변수명) 으로 입력시 전체 산점도..

(스터디 1-2주차) 혼자 공부하는 SQL Chapter 02 (진행중)

Chapter 02 실전용 SQL 미리 맛보기 02-1 건물을 짓기 위한 설계도 : 데이터베이스 모델링 데이터베이스 모델링이란? 데이터베이스 모델링 : 테이블의 구조를 미리 설계하는 것 테이블의 구조는 데이터베이스에서 가장 중요한 객체 현실 세계의 개체와 작업을 DBMS의 데이터베이스로 옮기는 과정 폭포수 모델 : 대표적으로 사용되는 프로젝트 진행 방식 (소프트웨어 개발 절차) 프로젝트는 현실 세계에서 일어나는 업무를 시스템으로 옮겨놓는 과정 (소프트웨어 개발)포수 모델 프로젝트 계획 : 온라인 쇼핑몰 구상 업무 분석 : 재고의 출납, 결제 방식 등 필요한 모든 업무 나열 및 정리 시스템 설계 : 정리한 업무를 컴퓨터에 적용할 수 있는 형태로 재설계 프로그램 구현 : 설계한 시스템을 프로그래밍 언어로 코..

(스터디 1주차) 혼자 공부하는 SQL Chapter 01

Chapter 01 데이터베이스와 SQL 01-1 데이터베이스 알아보기 데이터베이스의 개념 데이터베이스(Database, DB) : 데이터의 집합 데이터베이스 관리시스템(Database Management System, DBMS) 데이터베이스를 관리하고 운영하는 소프트웨어 데이터의 집합을 관리 + 대용량의 데이터 + 여러 사용자와 공유 예) MySQL, Oracle, SQL server, Maria DB Excel 은 DBMS가 아니다 구조화된 질의 언어 (Structured Query Language, SQL) DBMS에 데이터를 구축, 관리하고 활용하기 위해서 사용되는 언어 국제 표준화기구에서 정한 표준 SQL + 각 제품별 특징을 반영한 기능 표준 SQL : RDBMS에서 사용되는 언어 DBMS의 ..