데이터 분석 주제 추천 - deiteo bunseog juje chucheon

1. 금융 관련 빅데이터 분석 Project 아이디어

(1) 빅데이터분석을 활용한 환율예측 알림서비스

  • 목적: 1달이상의 장기적인 환율추이를 예측하여 고객이 유리한 환율조건에 환전할수있도록 한다.
    시나리오: 환율추이 시각화 -> 특정기간/특정조건에서 예약환전할수있는 서비스
    데이터: 과거환율(기술적지표), 뉴스제목(세계 정치경제 상황), 주가, 그외 경기지표
    역할분담: 선행연구조사 / 데이터별 수집 및 전처리 / 텍스트분석, 머신러닝, 벡테스팅 / 웹시각화
  • comment:
  1. 연관성 있는 데이터가 딱히 생각나지 않음. domain 지식부족
    뉴스제목수집 -> 텍스트 -> 단어 -> 환율에 긍정/부정인지 머신러닝
    참고: 2014년 빅데이터아카데미 우수사례집, 일일 환율 예측 프로젝트 p22

(2) 빅데이터분석을 활용한 코스피지수예측 알림서비스

  • 목적:
  1. 텍스트마이닝과 여러 다양항 지표들을 분석하여 코스피지수의 방향성을 예측하고자 한다.
  2. 투자자들에게 투자 결정 판단에 도움을 주는 정보제공 서비스
  3. 저금리시대 취업 후 재테크는 필수, 월급으로는 10년 일해도 서울에 집 한채 구매하지 못함.
  4. 데이터분석을 통해 예측이 가능한지, 예측의 정확도를 높일수있는지 확인
  • 시나리오: 단기/장기 예상추세 시각화, 상승하락 확률표시 -> 1일 카톡알림 (kodex200, 인버스 투자 가능)
  • 데이터: 과거지수(기술적지표), 신용, 수급 / 까페, 증권뉴스, 검색어트렌드 / 그외 경기 지표
  • 역할분담: 선행연구조사 / 데이터별 수집 및 전처리 / 텍스트분석, 머신러닝, 벡테스팅 / 웹시각화
  • comment:
  1. 환율예측과 유사하지만 조금 더 다양하고 특정범위의 데이터를 구할 수 있음
  2. 관련자료가 많아 조금더 쉬울 것 같음.
  3. 참고 “키워드 관련 지수 예측”, “구글 트렌드 주식”, “뉴스분석 주가예측” 등 구글 검색해 볼것.
  4. https://www.nature.com/articles/srep01684
  5. 참고: 2014년 빅데이터아카데미 우수사례집, 주가 예측 상관관계 분석 p16

한경컨센서스의 기업보고서 알림서비스, 키워드추출 및 자동요약 메일발송

  • 목적:
  1. 개인이 주식 투자시 증권사의 기업보고서 체크는 매우 중요
  2. 보고서의 요약정보(키워드)를 신속하게 카톡으로 알려주고 링크를 통해 보고서를 확인
  • 시나리오: 웹에 키워드 등록 -> 10분 주기 크롤링(감시) -> 출현 -> 링크, 키워드 추출 -> 카톡 발송
  • 데이터: 없음.
  • 역할분담: 기능별 분담 (앱개발 / 크롤링 / 알림/ pdf 키워드 추출)
  • comment:
  1. 한경컨센서스, 다트, 그 외 보고서 사이트(증권사?)
  2. pdf 자동 다운, pdf에서 중요 키워드 추출은 어떻게?
  3. 키워드에 대해 감성 분석 가능, 그 외 데이터분석 또는 머신러닝 활용 요소가 없음.
  4. 앱과 자동화기능 연계는 어떻게?

(4) 울산 아파트 시세 예측 서비스

  • 목적:
  1. 아파트 투자판단에 도움을 주는 지표를 제공한다.
  2. 아파트 실거래 또는 투자목적의 상황에서 의사결정에 도움을 주는 정보 제공 서비스
  • 시나리오:
  1. 분석대상은 울산의 아파트 가격으로 한정한다.
  2. 특정 아파트의 최근실거래가, 현재호가, 1달후예측, 1년추세를 시각화 제공
  3. 특정 아파트 주변의 교통,학군,인구변동 등 연관팩터에 대해 제공
  4. 시간 여유가 있으면 웹페이지 또는 앱 구현
  • 데이터: 과거 실거래가 / 거시경제지표(금리) / 교통(지하철) / 학군 / 인구변동(입출) / 기업 실적
  • 역할분담: 데이터별 분담 , 통합하여 머신러닝(2)
  • comment:
  1. 구할수있는 데이터가 매우 다양? 확인필요
  2. 참고 예시가 많다. Dacon대회, kaggle대회, 보고서 등
  3. 이미 유사 서비스들이 있다. (직방,부동산 지인) 차별점은? 정확도 비교 어떻게?
  4. 참고: 2017년 빅데이터아카데미 우수사례집, 기계 학습 방법을 활용한 신도시 아파트 가격변동 요인 분석
  5. 참고 url:
    https://dacon.io/cpt4
    https://bit.ly/2UuQvtU
    https://www.kaggle.com/c/house-prices-advanced-regression-techniques/

(5) 울산지역 살기좋은 동네찾기 서비스

  • 목적:
  1. 타지역에서 울산에 이사를 계획중인 (울산을 잘모르는) 사람이 온라인상으로 살기좋은 동네를 많이 물어봄.
  2. 아이들 키우기 좋은곳, 혼자 살기 좋은 곳 등 정보제공의 목적
  • 시나리오: 환경 / 인프라 / 교육 / 치안 / 교통 등 사용자가 선호하는 카테고리로 동네 추천
  • 데이터: 카테고리별 공공데이터 유무 확인 / 데이터통합 / 시각화
  • 역할분담: 데이터별 분담
  • comment: 머신러닝 필요 없음. 클러스터링이 필요한가?

<탈락된 아이디어>

(1) 빅데이터 분석과 머신러닝 등을 활용해 기업의 부실 징후 정보를 파악

  • 목적: 기업 부실 징후 예측을 통해 기업평가지표, 여신심사, 주식종목분석 등에 활용할수있다.
  • 데이터: 재무상태(순이익,부채,부채비율), 대출금리, 결국 사업보고서 내용으로 한정적, 해당산업의 상황
  • comment: 구할수있는 데이터가 한정적임. domain지식이 부족함.

(2) 포털사이트 뉴스 제목 분석을 통한 금리변동 예측

  • 위의 환율추이와 유사, 금리는 변동성이 작다. 하루단위로 바뀌지않음, 데이터가 많지 않음.

(3) OCR기술을 활용하여 고객 제출 서류 정보 추출하기

  • 목적: 예금가입, 대출서류, 영수증 등의 정보를 자동입력, 은행,회계 업무효율화
  • 시나리오: 서류 스캔 -> 정해진폼에 자동입력
  • 데이터: 관련서류, 필기체 이미지
  • 역할분담: 애매함.
  • comment:
  1. 시간적 여유가 없다, 역할분담은?
  2. 데이터는 어디서? 학습은? 필기체..기술적으로 어려울수있다.

2. 공공데이터 활용사례 참고사이트

  • http://www.startupidea.kr/award/
  • https://www.data.go.kr/useCase/exam/index.do

3. 금융상품별 아이디어 정리(2019.07.30)

  • 부동산
  • 주식
  • 가상화폐
  • 환율,원자재,금리
  • 예금,대출

4. 대략적인 계획(2019.08.30)

  • 선행연구조사, 참고문서공부, 리뷰는 모두같이 8/3~6(회의)
  • 데이터수집: 데이터별 분담(수집,전처리,시각화,연관성분석까지) 8/6~9
  • 데이터전처리: 데이터별 분담 8/9~12(회의)
  • 데이터상관분석(통계): 1명 8/9~
  • 텍스트마이닝, 뉴스감성분석: 3명 8/9~
  • 머신러닝, 백테스팅: 1명 8/12~
  • 웹시각화: 1명 8/9~

5. 소스코드 및 데이터 공유

  • 주소:
  • 팀원별 폴더생성, 각자 생성한 코드, 데이터를 업로드한다.

6. 최종 주제 선정

데이터 분석 주제 추천 - deiteo bunseog juje chucheon
  • 조원들과 의논 끝에 주제 선정이 어려워서 익명 투표 결과 다수결로 환율, 주가로 최종 주제 선정

  • Tags Project

데이터 분석 주제 추천 - deiteo bunseog juje chucheon

안녕하세요, Soa입니다!

٩( ᐛ )و

이제 개강도 했고.. (공부하기싫어병)

홍보 ucc 제작 때문에 분석 포스팅이 조금 없었습니다..

아직 홍보 ucc 제작은 끝나지 않았지만..!

운영국에서 메일이 왔습니당.......^^!

(우는거 아님)

데이터 분석 주제 추천 - deiteo bunseog juje chucheon

무려 10주간, 개인 분석 프로젝트를 A부터 Z까지 진행해야 한다는 사실...!

그래서 고민했습니다..

사실 분석 프로젝트를 진행했던 경험이 없기 때문에,

어떻게 10주간의 분석 프로젝트를 해야하나 막막했어요...

그러면서 든 생각이

원래 저는 마케팅에서 데이터 분석을 사용하는 방법에 대해 포스팅하고 싶었잖아요?

그럼 이번을 기회로,

마케팅 가설이나 주장에 대해서 힘을 실어줄 수 있게끔 하는

데이터 분석을 진행해봐야겠다고 생각했습니다!


나홀로 분석 프로젝트 (1) 분석 주제 선정

개인 분석 프로젝트에 대한 큰 방향을 잡았습니다!

그래서 제가 정한 프로젝트 명은...

"나도 이제 디지털 마케터!"

물론 디지털 마케터가 실제로 하는 일에 대해서는

실무를 해보지 않았기 때문에 정답이 아닐 수 있습니다!

실제로 데이터 분석이 어떻게 사용되는지에 대해서 찾아보다가

다음 글을 발견했습니다.

https://platum.kr/archives/133978

데이터로 마케팅 가설의 설득력을 높여라! - 'Startup's Story Platform’

#프롤로그 : 데이터의 힘 #1. 누구의 말이 더 신뢰 가는가? 마케터 A는 “요즘 일본 불매운동으로 떠들썩합니다. 지난주에 유니클로 매장을 우연히 지나쳤는데, 사람들이 거의 없더라고요”라는 �

platum.kr

데이터 분석 주제 추천 - deiteo bunseog juje chucheon

데이터 분석을 통해서 마케팅 가설, 주장에 대해서

설득력을 높일 수 있다는 것이죠!

단순히 데이터 분석 뿐만 아니라

데이터 분석을 토대로, 그 데이터 안에서 인사이트를 도출해내는 것!

이번 개인 분석 프로젝트에서

물론 데이터 분석에 대해서 열심히 공부하겠지만,

마케팅에서 데이터 분석이 이렇게 쓰일 수 있구나 하는 

그 과정에 대해서 자세히 포스팅하고자 합니다!


[프로젝트 목적]

위에서 언급했던 것처럼

데이터 분석을 마케팅에 어떻게 쓸 수 있는지에 대해서

공부하고 그 과정을 자세히 이야기하고자 하는데요.

목적을 간단하게 정리하자면 다음과 같습니다.

마케팅 가설을 설정한 후, 데이터 분석으로 가설을 검증해보는 과정을 실습해본다.

누구나 볼 수 있는 채널에서 소비자 데이터를 수집하여 데이터의 추이를 보며 가설을 주장에 설득력을 높여주고, 가설을 보완하는 방법을 배울 수 있다.

마케팅 가설을 설정하고, 그 가설을 데이터 분석을 통해 검증하려고 합니다!

간단하게 예를 들자면, 포스트 코로나 시대에서 온라인 쇼핑몰이 성장할 것이니 쇼핑몰을 만들어야 한다!

(조금 허접한 가설이지만..)

이런 식으로 마케팅 가설이나 주장을 설정하고

이에 대해 뒷받침할만한 근거로 분석한 데이터를 제시하는거죠!

예를 들어, 년도별 온라인 쇼핑몰 성장 추이 데이터 등이 있을 것 같습니다.

그래서 이러한 이유로 디지털 마케터가 되었다고 생각하고,

가상의 시나리오(내가 만약 ~라면)와 가설 등을 설정해서

그에 맞게끔 데이터 분석을 진행하고

분석 결과를 시각화하고, 나름 제안서? 분석 리포트를 작성해보고자 합니다!


[프로젝트 개요]

그래서 프로젝트는 간단하게 다음과 같이 진행될 예정입니다.

1. 설득력 있는 마케터 : 데이터 분석, 가설 검증이 필요한 이유

2. 분석 시나리오 설정 : ‘내가 만약 삼성SDS 마케팅 담당자라면?’

3. 제안을 위한 근거 만들기, 데이터 분석

4. 데이터 분석 결과 시각화

5. 결과 분석 및 인사이트 도출

여기서 2번의 분석 시나리오 설정에 대해서

조금 이야기해보겠습니다..!

가능한 시나리오가 여러 가지 있고, 정말 많이 고민해보았습니다..

사실 어느 기업에 소속된 마케터라면,

해당 기업에서 수집한 판매 데이터, 구매 전환 데이터 등과 같은

소비자 데이터가 있기 때문에 그와 관련된 가설을 세울 수 있겠지만

제가 수집할 수 있는 데이터에는 한계가 있기 때문에

많은 가설들을 포기했습니다.. ㅠ_ㅠ

그래서 공개되어 있는 데이터들 중에서 얻을 수 있는

소비자 데이터를 생각해보니,

네이버 데이터랩, 구글 트렌드 등과 같은

많은 사용자들이 이용하는 채널에서 제공하는 소비자 데이터가 있더라구요!

그런데 어떤 기업에 소속되어 있는 마케터라는 설정은 포기한거 아닌가요?

할 수도 있겠지만!

제가 설정한 시나리오는

‘내가 만약 삼성SDS 마케팅 담당자라면?’

이겁니다!

내가 만약 삼성SDS 마케팅 담당자라면!

Brightics 서포터즈를 모집해서, Brightics를 홍보하자는 전략에 대해서

어떠한 근거를 통해서 이야기하고,

그 근거를 어떤 데이터를 어떻게 분석해서 제안했을까?

라는 생각을 했습니다!

물론 진짜 담당자님께서는.. 저보다 높은 퀄리티의 제안서(?)를 작성하셨겠지만..

일단 한번 제안서(라고 부르는건지 모르겠지만) 작성 과정을

실습해보고자 합니다!


자세하게 어떤 데이터를 사용해서 어떻게 할건지에 대해서는

나중에 포스팅할 때 자세하게 이야기할 예정입니다..!

궁금하셔도 참아주세요!

٩( ᐛ )و

그럼 다음 포스팅에서는

좀 더 자세한 내용으로 만나요~!

안녕!

٩( ᐛ )و

* Brightics 서포터즈 활동의 일환으로 작성된 포스팅입니다. *