본문 바로가기

딥러닝 입문 딥러닝이란? (Deep Learning -> 말그대로 학습시키는 일) 딥러닝, 심층학습은 여러 비선형 변환기법의 조합을 통해 높은 수준의 추상화(abstractions, 다량의 데이터나 복잡한 자료들 속에서 핵심적인 내용 또는 기능을 요약하는 작업)를 시도하는 기계학습(machine learning) 알고리즘의 집합으로 정의되며, 큰 틀에서 사람의 사고방식을 컴퓨터에게 가르치는 기계학습의 한 분야라고 이야기할 수 있다. 어떠한 데이터가 있을 때 이를 컴퓨터가!ㅇㄱㅎㄴ로 표현(representation)하고 이를 학습에 적용하기 위해 많은 연구(어떻게 하면 더 좋은 표현기법을 만들고 또 어떻게 이것들을 학습할 모델을 만들지에 대한)가 진행되고 있으며, 이러한 노력의 결과로 deep neural networ..
text mining 미완성 --- title: "Textmining" output: word_document --- ```{r} #데이터 로드 twitter
R markdown 사용법! R markdown이란? 마크다운은 데이터 분석의 전 과정을 담은 보고서를 쉽게 만들 수 있는 패키지다. 이를 이용하면 html, word, pdf 등 다양한 포맷으로 저장할 수 있기 때문에 별도의 문서 작성 소프트웨어를 사용하지 않고도 훌륭한 데이터 분석 보고서를 만들어낼 수 있다. R markdown 이용하는 방법 1. markdown 은 패키지다. 그러므로 r_studio에서 rmarkdown 패키지를 script에서 아래와 같은 명령어를 쓴 뒤 설치해준다. install.packages("rmarkdown") 2.패키지가 다 설치되면 New file 창에서 이와 같이 R markdown 이라는 것을 찾아볼 수 있을것이다. 3.R markdown을 클릭해서 들어가면, 아래와 같이 뜬다. markdo..
삼성의 AI 신기술 개발 삼성이 최근에 사진 1장만 있으면 다양한 얼굴 표정과 움직임이 담긴 가상 인터뷰 동영상을 만들 수 있는 AI 신기술을 개발해서 화제가 되고있다. 삼성전자의 러시아 모스크바 AI연구센터는 얼굴 이미지 사진을 '말하는 얼굴 동영상(talking head videos)'으로 손쉽게 변환할 수 있는 새로운 기술을 최근 선보였다. 실제로 이번 기술개발에 참여한 한 연구원은 영화배우 마릴린 먼로의 사진과 세계적인 명화 모나리자 등을 변환한 가상 인터뷰 동영상을 유튜브에 게재했다. 1장의 사진만으로 실제와 구분하기 어려운 가상 동영상을 만들 수 있으며, 그것으로 애니메이션까지도 제작해낼 수 있다는 것이다. 또한 이 기술은 기존의 AI 합성 기술인 '딥페이크'와는 달리 3차원 모델링이 필요없고 빠른 속도로 할 수 있다..
클라우드를 왜 써야할까? 클라우드! 왜 이용해야 할까? 최근 클라우드를 도입하는 기업들이 기하급수적으로 늘어나고 있습니다! 대기업에서는 없어서는 안 될 정도로 필요성이 증가하고 있다! 그렇다면 클라우드의 장점으로는 뭐가 있을까? 첫째, 자원 활용성을 증가시킨다. 클라우드는 원래 중앙 센터에서 사용되지 않고 낭비되는 컴퓨팅 자원을 활용하기 위해 등장했다. 즉 사용하지 않는 자원을 필요로 하는 사용자에게 원격으로 컴퓨팅을 제공하는 것이다. -> 자원의 활용성을 증가시킨다. 둘째, 운영 효율성을 증가 시킨다. 흩어진 자원을 개별로 힘들게 관리하지 않고 중앙에 모인 자원을 관리하는 이점이 있다. 운영상 편리할 뿐만 아니라 효율성도 향상된다. 셋째, 인공지능(AI) 서비스를 확장 시킨다. 현재 주목을 받는 기계학습(Machine Lear..
5단원 분석 도전! p.123 ggplot2 패키지에는 미국 동북중부 437개 지역의 인구통계 정보를 담은 midwest라는 데이터가 들어 있습니다. midwest 데이터를 사용해 데이터 분석 문제를 해결해보세요. 문제 1. ggplot2의 midwest 데이터를 데이터 프레임 형태로 불러온 다음 데이터의 특징을 파악하세요. install.packages("ggplot2") library(ggplot2) df_raw
5단원 리뷰 5-1 데이터 파악하기 데이터를 파악할 때 사용하는 함수들 1.head() - 데이터 앞부분 확인하기 head(데이터 프레임 이름) #앞에서부터 6행 출력 head(데이터 프레임 이름, n) #앞에서부터 n행까지 출력 2.tail() - 데이터 뒷부분 확인하기 tail(데이터 프레임 이름) #뒤에서부터 6행 출력 tail(데이터 프레임 이름, n) #뒤에서부터 n행 출력 3.View() - 뷰어 창에서 데이터 확인하기 4.dim() - 데이터가 몇 행, 몇 열로 구성되었는지 알아보기 dim(데이터 프레임 이름) #행, 열 출력 5.str() - 속성 파악하기 데이터에 들어있는 변수들의 속성을 보여준다. 6.summary() - 요약 통계량 산출하기 5-2 변수명 바꾸기 dplyr 패키지의 rename()..
4단원 리뷰 4-1 데이터 프레임 이해하기 ‘열’은 속성이다. ‘행’은 한 사람의 정보다. - 한 명에 대한 데이터는 가로 한 줄에 나타난다. Ex) 성별 연령 학점 연봉 남자 26 3.8 2,700만원 여자 42 4.2 4,000만원 남자 35 2.6 3,500만원 “데이터가 크다” = 행이 많다 or 열이 많다. 결론적으로는 열이 많은 것이 더 중요하다. 열 증가 > 변수를 조합할 수 있는 경우의 수 증가 > 여러 변수의 영향을 동시에 고려할 수 있는 복잡한 분석 방법을 활용해야 할 필요성이 생긴다. 행 증가 > 컴퓨터가 느려짐 > 고사양 장비 구축 데이터 프레임 만들기 1.변수 만들기 English