읽을거리

2021-06-27 읽을거리

scjung 2021. 6. 27. 22:44

python

1. python의 8가지 built-in 함수

이전에 공유한 built-in 함수 글들과 겹치는 부분들도 있지만 새로운 함수들도 있어서 볼 만 하다

https://levelup.gitconnected.com/8-built-in-functions-every-python-programmer-should-know-3552eb768894

 

8 Built-in Functions Every Python Programmer Should Know

Python functions that are amazing and useful

levelup.gitconnected.com

 

2. python 에서 큰 데이터셋을 효과적으로 읽는 방법

주요 키워드는 yield 를 사용한 generator이다. for 문에 open 함수를 사용하는 건 이전에 생각지 못한 코드이다.

https://medium.com/programming-for-beginners/how-to-use-python-generators-to-efficiently-process-large-data-sets-38e18bd8ae29

 

How to Use Python Generators to Efficiently Process Large Data Sets

Introduction to python generator functions.

medium.com

 

3. loop문에 대한 병렬 처리 비교 & 병렬 처리의 데이터를 공유하는 dictionary에 저장

반복문을 더 빠르게 처리하고 싶으면 해당 글을 읽어보는 것을 추천

https://medium.com/daily-programming-tips/how-to-parallelize-for-loops-in-python-and-work-with-shared-dictionaries-76a5560254cd

 

How to parallelize for loops in Python and Work with Shared Dictionaries

This article will cover the implementation of a for loop with multiprocessing and a for loop with multithreading. We will also make…

medium.com

 

4. "==" 와 "is"문에 대해 low level로 비교 고찰

프로그래밍의 개념을 심도 있게 알고 싶다면 이런 종류의 글들을 읽는 것을 추천

https://medium.com/techtofreedom/string-interning-in-python-a-hidden-gem-that-makes-your-code-faster-9be71c7a5f3e

 

String Interning in Python: A Hidden Gem That Makes Your Code Faster

Level up the speed of string comparisons

medium.com

 


 

ML/DL

1. 쇼핑 상품 카테고리 분류의 multimodal machine learning 설명

이후 이어서 글을 작성할지는 모르겠지만 해당 내용만으로도 기본적인 개념은 파악할 수 있다

http://hyunje.com/data%20analysis/2021/06/26/multimodality-in-product-classification.html

 

쇼핑 상품 카테고리 분류에서의 Multimodal Machine Learning

이 글에서는 왜 Multimodal Machine Learning에 대해 Survey를 시작하게 되었는지, 어떻게 진행하고 있는지에 대해 설명한다.

hyunje.com

 

2. pandas에서 피해야 하는 함수들 5가지

https://towardsdatascience.com/please-stop-doing-these-5-things-in-pandas-9fbabea897aa

 

Please Stop Doing These 5 Things in Pandas

These mistakes are super common, and super easy to fix.

towardsdatascience.com

 

3. pandas의 read_csv를 잘 쓰는 법

2번 내용과 대치되는 부분이 있지만 modin.pandas로 대체하여 사용하면 될 듯 하다

https://medium.com/gustavorsantos/go-next-level-with-pandas-read-csv-29e3c207a66d

 

The Next Level of Pandas read_csv( )

9 underused parameters of the well know Pandas’ read_csv() method.

medium.com

 

4. 베이즈 이론에 대해 시각적으로 설명

https://pub.towardsai.net/understand-bayes-theorem-through-visualization-8ec99a0577e4

 

Understand Bayes’ Theorem Through Visualization

Gentle introduction to Bayes’ theorem using visualization and why it is not difficult as some may say

pub.towardsai.net

 

5. PHOTONAI : 머신러닝 파이프라인 & AutoML 을 high API로 제공하는 라이브러리

다른 파이프라인, AutoML 라이브러리와 이후 비교해봐야 할 것으로 보인다

https://github.com/wwu-mmll/photonai

 

wwu-mmll/photonai

PHOTONAI is a high level python API for designing and optimizing machine learning pipelines. - wwu-mmll/photonai

github.com