Page tree
Skip to end of metadata
Go to start of metadata

데이터 중심 애플리케이션 설계 보기

소개

데이터 중심 애플리케이션 설계 책의 부제는 ‘신뢰할 수 있고 확장 가능하며 유지보수하기 쉬운 시스템을 지탱하는 핵심 아이디어’입니다. 애플리케이션 레벨에서 확장해 널리 시스템을 조망해 봅니다.

시간

매주 일요일 오후 9시부터 11시 (예상)

참여자

오시영 강은지 이사임 오민호 주환석

김아름 박용훈 이정훈(빨간색소년) 김태일 조범진

예상 스터디원

책 내용을 훑어보았을 때 자신에게 필요할 거라고 판단되는 분

예상 스터디 인원: 6명

진행 방법

4월 3일부터 스터디가 진행되고 있습니다. 새로운 분들이 합류하시는데 불편함이 없도록 논의 후 필요하다면 나간 진도들은 복습 차 다시 진행할 예정입니다. 부담 없이 조인해 주세요.

  1. 지금 여기서 이해도를 높입니다.

    모여서 읽고 소화하면서 이야기 - 바쁜 직장인을 위한 스터디 비결

    그리고 매 스터디에서 함께 공부한 부분 중에서 내가 직접 읽은 것과 그렇게 하지 않은 것의 비율이 높은 차이가 나지 않게 합니다. 1:1이나, 1:2 정도가 좋습니다.

    바쁘시죠? 발제 준비 부담스러워서, 미리 공부하는 거 부담스러워서 증발할 때 있으시잖아요. 와서 소화해 봅시다. 한 번의 어렵게 아니라 여러 번 차근차근해 나갑니다.

    • 짧은 시간에 적어도 세 번 이터레이션을 돌면서 이해를 확장할 수 있습니다.
    • 읽고 끝낸다 X, 다른 사람과 함께 생각 확장 O
  2. 써먹으려고 배웁니다.

    • 내가 처한 문제를 해결하기 위해서, 각자 중요/필요한 부분을 골라서 논의합니다.
    • 지금까지 이야기된 부분은 1장 읽고 5장 읽기. 이후 읽을 챕터는 읽으면서 논의
    • 회고 시간에 이야기하며 진짜 문제를 해결하기 위해 바꿀 거예요.
    • 앞으로 경험을 공유하거나 읽고 해볼 시도로 확장해 나갈 수도 있으며, 책을 꼭 챕터별로 보는 걸 하지 않을 수도 있습니다.
  3. 스터디 방식도 리팩터링

    • 스터디 시간은 필요하다면 늘리거나 줄이기
    • 스터디 방식은 매주 회고하면서 적절하게 바꿔 나갈 수 있습니다.

예상 결과물

스터디에서 오가는 이야기 로그 또는 대화 스크립트를 Wiki에 정리

Airflow 2.0

소개

Apache Airflow 기반의 데이터 파이프라인이 나왔습니다. Marc Lamberti의 Udemy 강의로 부족한 부분을 함께 채우고 실제 사례를 공유하는 시간이 있으면 합니다.

시간

매주 월요일 9시부터 10시

참여자

김학건 임도형 김미하 강대권 이고운 한진욱

  • 대표: 김학건 
  • 총무: 
  • 페이스북 페이지 담당자: 

예상 스터디원

  • Airflow를 설치해서 헬로 월드를 해 보신 분
  • Airflow를 K8s 환경에서 돌리시는 분
  • 기깔나는 DAG 구성을 자랑하고 싶으신 분
  • 실제 업무에서 사용해 보신 분

예상 스터디 인원: 5

진행 방법

  • 한 명씩 돌아가며 주제를 정하고 화면 공유를 통해 사례를 보여 주거나, 서비스를 클라우드에 올려서 함께 실습해 봅니다.
  • 주제 예시
    • 새로운 DAG 작성법인 Taskflow API에 익숙해지기
    • 특정 상황을 정해서 어떤 구성이 가장 좋은지 논의
      • Spark Job은 어떤 식으로 돌리는 게 좋을까?
      • SparkJDBCOperator vs Kubernetes Operator vs SparkSqlOperator vs SparkSubmitOperator
    • 에러 상황 시 분기 처리는 어떻게 하는 게 좋을까?

예상 결과물

Airflow 2.0의 새로운 문법 학습과 상황별 사례 정리

Real MySQL 8.0 Vol. 2 읽기

소개

서버 개발자가 반드시 읽어야 하는 Real MySQL 8.0 (2권)을 함께 읽어요.

시간

매주 목요일 오후 9시부터 11시

참여자

 이사임 박수영 천정대 김대겸 박종훈 강태윤 현진호 주병규 강은지 박상도 김윤정 윤미현

  • 대표: 이사임
  • 총무: 
  • 페이스북 페이지 담당자: 

예상 스터디원

MySQL을 공부하고 싶은 분이라면 누구나

예상 스터디 인원: 8

진행 방법

Real MySQL 8.0을 삼색볼펜법으로 미리 읽고 밑줄 친 부분을 함께 나눠요.

예상 결과물

Real MySQL 8.0 내용을 정리한 Wiki

golang 기본 배우기

소개

golang의 기본을 공부하고 싶다는 생각이 항상 마음속 깊은 곳에 있었습니다. 같이 기본을 배우고, 간단한 api를 만들어보는 시간을 가져봅시다.

시간

격주 수요일 오후 8시 이후. 4/20 시작

참여자

현진호 장진달 강한용 박재성(Jason)

예상 스터디원

다른 언어로 서버개발을 해본 분

예상 스터디 인원: 6

진행 방법

  1. golang의 공식 튜토리얼을 따라하며 기본을 익힌다.
  2. 함께 하나의 요구사항을 정해서, 이를 api로 구현해본다.

예상 결과물

golang으로 구현된 rest api

Kotlin 톺아보기

소개

코틀린을 사용하지만 코틀린에 대한 이해도가 낮은 코린이와 코틀린을 더 잘 알고싶은 이들을 위한 스터디 입니다. 

시간

매주 목요일 8 - 10시

참여자

이동철 이사임 주환석 조이수 강태윤 문혜영 이시훈 박상도 @김현기

예상 스터디원

코틀린을 모르거나 코틀린에 대한 기본 이해가 있는분 모두 환영합니다. 

예상 스터디 인원: 6

진행 방법

Kotlin In Action 및 Effective Kotlin을 활용하여 진행예정이며 Kotlin In Action 은 가볍게 읽거나 버전업에 따른 변경점들에 대하여 학습 예정, Effective Kotlin 을 정독하며 삼색 볼펜법 또는 다같이 읽는 시간을 가지는 등 스터디원들과 논의하여 결정.

  • 스터디 초반 Kotlin In Action 을 빠르게 진행 후 Effective Kotlin 병행 

예상 결과물

코틀린 기초 부터 심화까지 정리된 wiki

데이터 경진 대회 참여해 보자. 딥러닝으로.

소개

데이터 경진 대회에 참여하기 위한 풀 싸이클을 돌아 봅니다. 그것도 딥러닝으로. 그런데 도구로써의 딥러닝입니다. 심오한 수학이나 통계, 없습니다. 개발자 수준으로 가져다 쓰는 딥러닝 입니다.

그냥 데이터 경진대회 참여하려는데 이에 대한 가이드 혹은 도움을 드리는 스터디 입니다.

시간

격주 수요일 8시부터 10시까지

참여자

임도형 강한용 이고운 박재성(Jason)

  • 대표: 임도형 
  • 총무: 
  • 페이스북 페이지 담당자: 

예상 스터디원

코딩은 익숙. 파이썬... 맨코딩은 아니라도 가져다 쓸수 있는

예상 스터디 인원: 10

진행 방법

개요

실제 데이터를 가지고 딥러닝 코딩을 통해 대회에 참여하는 것을 목적으로 합니다. 대회에 참여한다고 해서 상위 입상을 목적으로 하지 않습니다. 그보다는 데이터 입수와 처리, 딥러닝 적용, 튜닝, 결과물 생성 등의 전체 흐름을 해보고 딥러닝 데이터 처리의 자신감을 얻고자 합니다. 심오한 딥러닝이 아닌 가져다 쓰는 도구의 관점으로 딥러닝을 대하려 합니다. 수식이나 통계 몰라도 됩니다. Spring 내부 몰라도 잘만 쓸 수 있잖아요. 아래 커리큘럼을 보시면 딥러닝에 대한 사항은 6차 중에 겨우 1차 뿐입니다. 가져다 쓰는 딥러닝입니다.

매 스터디 때에는 미션안내와 피드백을 스터디 리더가 진행합니다. 미션을 수행하기 위한 자료들은 일단 제공합니다. 자료 활용과 공부와 미션수행은 스스로 하는 것이고. 스터디 시간에는 진행된 것에 대한 피드백을 제공합니다. 모든 분에 대하여 피드백을 제공할 수는 없고, 두분 정도가 적당할 것 같습니다. 피드백 이후에 다음 미션에 대한 자세한 설명을 드립니다.

스터디에 참여하시고 미션의 설명을 듣고, 다음 스터디 때까지 전달된 자료를 가지고 미션을 수행하시고, 스터디 시에는 자신의 혹은 다른 분의 결과물에 대한 피드백을 받고. 실제 데이터를 가지고 대회에 참가하는 것인데, 스터디를 통해서 가이드를 혹은 도움을 받는 형태로 진행하는 겁니다.

커리큘럼

1차 : 기반 환경과 데이터 준비, 로딩

  • colab or kaggle vm
  • linux command
  • 다양한 소스(kaggle, http, github, db, google drive, AWS S3)
  • 다양한 포멧(zip, tar, npy, csv, xlx)

2차 : 데이터 전처리, 시각화

  • 데이터 전처리 : 결측치, 이상치, 코드성 데이터 인코딩, 정규화
  • pandas로 데이터 전처리
  • numpy로 데이터 전처리
  • 데이터 시각화 : histogram, image 그리기, 선 그래프 그리기

3차 : ML(머신러닝)으로

  • 대회의 데이터를 가지고
  • SVM, Decision Tree, Gaussian Process, Random Forest, linear regression
  • classification, regression

4차 : DL(딥러닝)으로

  • 3차에서 ML로 했던 것을 DL로.
  • regression
  • classification

5차 : 대회 출품

  • 결과물 만들기
  • 성능 개선
  • 오버피팅 처리
  • 데이터 증강
  • 결과물 출품

6차 : 개선 혹은 한번 더

  • 5차의 것을 더 성능 개선해서
  • 혹은 다른 대회 것을 한번 더

예상 결과물

대회 출품과 등수.

2시간 모각코

소개

시뮬레이션 돌려보며 입증한 스터디 형태입니다. 계속 다듬어 가고 있지만 마무리 회고를 통해 상대방이 어떤 인사이트로 학습을 접근했는지 문제해결을 어떻게 했는지 알 수 있습니다. 마지막엔 자기 자신에게 잘했다며 토닥토닥 해줍시다. 2022년 트렌드 바른이루틴이 있습니다. 이번 기회에 좋은 습관 만들고 다른 사람들과 시너지 내 볼 방법 찾아보는건 어떨까요? 함께 혜영!!!!과 함께 해요!!

시간

격주 월요일, 오후 8시부터 오후 10시(4월 25일, 5월 9일, 5월 23일, 6월 13일)

참여자

문혜영 박용훈 김성주 김민식

예상 스터디원

  • 업무 시간 필요한 공부나 하고 싶으 공부 의지약해서 힘드시다면 같이 해보는건 어떨까요?
  • 마지막이나 중간엔 오프라인으로 모각코 진행해서 뒷풀이 해보는 건 어떨까요?
  • 함께하시죠!! 늦었다고 시작하는 때가 가장 빠른 때입니다!

예상 스터디 인원: 5

진행 방법

  • 처음 참여하실 경우, 10분 전에 미리 참여해주세요!
  • 뽀모도로 웹페이지에서 25분 공부하고 5분쉬는 작업을합니다.
  • 구글스프레드시트에 25분동안 몰입할 내용을 적어줍니다.
  • 4번 사이클을 완료했을 때, 한 자리에 모여 각자 오늘 한 일에 대해서 이야기를 나눕니다. ('혱'을 Follow 해주세요!) 

작업 장소

  • 게더타운(참여 시, 링크 공유하겠습니다) or 오프라인 모각코 1회(5월 9일 오프 모각코 예정)
  • 게더에서 ‘혱’을 Follow해주세요!

예상 결과물

회고 기록물 혹은 프로젝트 완성

  • No labels