여러 개의 커밋을 하나로 묶기
너무 많은, 자잘한 커밋도 독이 될 수 있습니다. 🌃 배경 Git을 이용해 지금까지의 작업들을 순차적으로 커밋해왔다고 가정하겠습니다. 일련의 작업들을 커밋하고나서 확인해보니 중간의 여러 작업들을 굳이 여러 커밋으로 나눌 필요가 없음을 깨닫습니다. 아래 이미지는 지금까지의 작업에 대한 그래프입니다. 최초 A 파일 생성 후 develop...
너무 많은, 자잘한 커밋도 독이 될 수 있습니다. 🌃 배경 Git을 이용해 지금까지의 작업들을 순차적으로 커밋해왔다고 가정하겠습니다. 일련의 작업들을 커밋하고나서 확인해보니 중간의 여러 작업들을 굳이 여러 커밋으로 나눌 필요가 없음을 깨닫습니다. 아래 이미지는 지금까지의 작업에 대한 그래프입니다. 최초 A 파일 생성 후 develop...
Python에도 추상 클래스는 있지만 다른 언어들하고는 조금 다릅니다. 들어가며 객체지향 언어를 강력하게 만들어주는 것 중 하나는 바로 상속과 다형성입니다. 모든 개발에 있어 기본으로 쓰이는 이 기능들은 기존에 작성된 클래스를 재사용하여 유지보수 비용을 줄일 수 있도록 하고 코드 작성을 간결하게 만들 수 있습니다. 그런데 이런 좋은 기능들을 ...
Pandas에서 Nested list를 펼치려면 폭파시켜버리면 됩니다. 💣 🌃 배경 데이터프레임을 다루다보면 컬럼 내에 리스트가 Nested된 형태가 가끔 있습니다. 자주 겪을 수 있는 케이스는 아니라 pandas 내에 이걸 처리하는 메서드가 있을거란 생각을 안해봤는데요. 이런 케이스입니다. >>> df = pd.DataFra...
Jupyter Notebook이 참 좋은데 참 별로란 말이죠? 🛴 들어가며 2015년 말부터 데이터에 대해 공부하며 처음 쓰기 시작한 언어는 R이었습니다. 당시를 떠올려보면 데이터 분석은 곧 R을 의미했었습니다. 많은 책들이 쏟아져 나오고 있었고, 워드클라우드를 그릴 줄 아는 것이 기본 소양이었습니다. 공부를 더 하다보니 캐글을 접하게 되고, ...
🤬 Unhandled type for Arrow to Parquet schema conversion: halffloat 🖼 배경 최근 데이터를 저장하고 불러올 때, 빠른 I/O 속도와 컬럼의 데이터 타입을 메타 데이터로 저장할 수 있어서 Parquet 타입을 자주 사용하고 있습니다. Dependency로 pyarrow나 fastparquet만 ...