데이터리드가 될 예정입니다.

  • 홈
  • 태그
  • 방명록

databricks 1

Databricks에서 원하는 조건의 순서에 맞게 배열 정렬하기

부제: 데이터 분석가는 그의 업무시간 중 70%를 데이터 전처리에 쓴다.  챗GPT와 논쟁 → 구글링 → 각종 도큐멘트 정독 등등의 과정을 거치며 알아낸 정보를 기록해둔다. 나중에 같은 문제를 맞닥뜨린 누군가가 해당 글을 통해 더 빠르게 문제를 해결할 수 있기를...🙏  내가 마주한 문제우리 서비스의 고객 행동을 분석하고, 관련 지표를 설계하던 중 로우데이터의 일부를 하나의 배열 안에 넣을 필요가 있었다. 근데 배열 안에 데이터를 넣을 때 event_time 순서대로 넣어야 했다. 예를 들면, 이러한 로우데이터를 가공을 통해 아래와 같은 데이터를 만들어내야 했다.   흠, 쉽네.ARRAY_AGG()로 film을 묶은 다음에 event_time 기준으로 ORDER BY 하면 되겠군.   PostgreS..

데이터 2025.01.12
이전
1
다음
더보기
프로필사진

데이터리드가 될 예정입니다.

데이터를 무기로 비즈니스 가치를 창출하는 데이터 리드가 되고자 노력 중입니다 :) 스스로를 Full-stack Data Expert로 소개할 날을 꿈꿉니다.

  • 분류 전체보기 (51)
    • 일상&잡담 (6)
    • 관심있는 이슈들 (3)
    • 데이터 (19)
    • 개발공부 (20)
    • 책리뷰 (2)

Tag

대격변ai시대데이터로사고하고데이터로리드하라, data analysis, Spark, cqgr, 2025새해다짐, 책리뷰, 데커톤, attribution model, 자연어처리, dakerton, JAVA쪼렙탈출기, 스터디, 개발공부, 일상, GPT, 인과추론, java, nlp, 데이터분석, 데이터,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바