Computer Science65

Greedy * intro "현재 상황에서 지금 당장 좋은 것만 고르는 방법" → 일반적인 그리디 알고리즘은 문제를 풀기 위한 최소한의 아이디어를 적절히 떠오르면 풀리는 경우 많음 → 단순히 가장 좋아보이는 걸 반복적으로 선택해도 최적의 해를 구할 수 있는 지 검토하게 된다. → 일반적인 상황에서 그리디 알고리즘은 최적의 해를 보장할 수 없는 경우가 많음 → 하지만 코딩 테스트에서의 대부분 그리디 문제는 탐욕법으로 얻은 해가 최적의 해가 되는 상황에서, 추론할 수 있어야 풀리게 출제 ★ 주어진 문제를 모든 상황을 다 고려한 채로, 각 상황의 최적의 결과를 상황별로 계속 모으면, 그 결과가 곧 최적의 결과가 되는 유형이 greedy 유형 ☆ 주의점: 문제의 모든 상황을 생각해야 하고 / 각 상황의 greedy한 솔루션.. Computer Science/Algorithms 2022. 9. 12.
Data Handling 기초적으로 알아야 하는 총 4개의 데이터 타입에 대해서 정확히 알아보고(돌다리 두들기고!) 넘어가자 :) ※ 이런게 있다고 기억하고 추후 정보를 조금씩 추가하는 방식! CSV(Comma Separated Values) 💐 필드를 쉼표로 구분한 텍스트 파일이다. 왜 쉼표로 굳이 분리했냐면, 엑셀 양식의 데이터를 프로그램에 상관없이 쓰기 위해서 데이터 형식으로 만들었다고 보면 된다. 엑셀에서는 '다른 이름 저장' 기능으로 사용 가능하다. notepad로 열면 쉼표로 데이터가 구분되어 표현됨 💐 여기서 text 파일 형태로 데이터 처리 시 문장 내에 들어가 있는 "," 등에 대해 전처리 과정이 필요하다. 파이썬에서는 간단히 CSV 파일을 처리하기 위해 csv 객체를 제공해줌. (+한글로 되어 있다면 별도 한글.. Computer Science/Basics 2022. 7. 15.
feature scaling 👩‍🍳 data를 요리하기 위해 빈번히 해주는 여러 기법들이 있다. 이 기법들을 배워보는 시간을 가지려 한다. feature scaling은 대표적인 방법 중 하나로, data feature별 제각기 다른 범위를 갖고 있음을 파악하고 동일한 범위, 동일한 선상에 맞게 설정해 scaled된 여러 row별 data를 서로 쉽게 비교할 수 있게끔 해준다. scaling을 안한다면, 범위가 더 넓은 variable이 값 자체만으로 상대적으로 다른 variable에 비해 modeling에서 불공평하게 많은 비중을 차지할 수 있어, 해당 문제점을 방지하기 위해 scaling이 권장된다. 👩‍🍳 scaling과 standardization? → scaling은 기존 주어진 value의 range를 바꾸어 다른 분포로.. Computer Science/Basics 2022. 6. 22.
Data Analysis with Python (2/2) (from Coursera) 4) Model Development * A Model = a mathematical equation used to predict a value given one or more other values - Relating one or more independent variables to dependant variables (ex) 'highway-mpg' -> model -> 'predicted price') - the more relevant data have, the more accurate the model is - more data is important - different types of model) simple, multiple, and polynomial regression (1) Simpl.. Computer Science/Basics 2022. 4. 24.
Data Analysis with Python (1/2) (from Coursera) 1. Importing Datasets * Why Data Analysis? - data is everywhere - helps us answers from data - discovering useful info / answering questions / predicting future or the unkown * Understanding the Data - target(label) = the name of the attribute that we want to predict - CSV(Comma Separated Value) file = source of data * Python Packages for DS (1) Scientific Computing Libraries * Pandas) data stru.. Computer Science/Basics 2022. 4. 22.
in where? 🦸‍♀️ - AI examples 1. 제조/IoT 산업 내 AI 혁신과 스마트팩토리 [1] 제조 분야 {1} 스마트팩토리 - 제조 생산을 위한 수직적 통합 및 네트워크화된 제조 시스템을 갖춤 - 제조 공정 및 운영 데이터와 통합 - 오작동모니터링(설비혁신) -> 제품성능모의실험(품질혁신) -> 데이터 기반 의사결정 최적화(운영혁신) 순서로 진행 * 오작동 모니터링 - 기계 설비의 오작동율은 환경(제조율, 습기, 온도 등)에 따라 다름 - 따라서 특정 센터 1-2개만으로 오작동을 예측하기에는 정확도의 한계가 존재 - 다양한 데이터에 기반한 AI를 사용하여 한계 극복, 오작동 시점을 예측 가능 * 제품성능모의실험 (Digital twin) - 실제 공장을 만들어 제품 생산을 테스트하는 데에는 막대한 시간과 비용 소모 - 데이터에 기반한 가.. Computer Science/Basics 2022. 4. 17.
What is Data Science? (from Coursera) 1) Defining Data Science & What Data Scientists Do * What is Data Science? = the field of exploring, manipulating, and analyzing data, and using data to answer questions or make recommendations. → what is NEW? the vast quantity of data available from massively varied sources * the process of data science - many organizations use data science to focus on a specific problem, and so it's essential .. Computer Science/Basics 2022. 4. 13.
Tidy Data * 실제 사용되는 데이터는 하나의 완벽한 dataset이 아닌 여러 개로 쪼개진 경우가 많다! → 따라서 분석하기 용이하게 하나의 dataset으로 만들기 위한 과정이 필요 1. Tidy Data란? "각 변수가 열이고 각 관측치가 행으로 배열된 data (by Hadley Wickham)" - columns에 있던 data를 row로 녹인다고 생각하면 쉬움! - seaborn 시각화할 때 짧은 코드로 가능! (매우 편리) ↓↓↓↓ box plot 시각화할 때 사용한 tidy data 예 살펴보기 ↓↓↓↓ violin plot (+seaborn) * EDA에 대해 알아보았고 EDA 과정에서 많이 쓰이는 시각화 방법 중 box plot에 대해 자세히 알아보았다. box plot (+seaborn) * 저번.. Computer Science/Concepts 2022. 4. 13.
(basic) CLI & 간단 명령어 (linux) & python 가상환경 CLI vs. GUI 🤸🏽 기초지식으로 알아야 할 부분들 정리해보려 한다! 🤸🏽 1> CLI(Command Line Interface) = '글자 기반으로 명령과 결과가 진행되는 환경' * 터미널(terminal) ≫ 글자 기반으로 명령을 전달하는 어플리케이션 → CLI를 통해 shell이 실행됨 (The shell is basically a program that takes your commands from the keyboard and sends them to the operating system to perform) → 운영체제 OS가 작동되게 하는 shell program은 키보드 입력으로 받은 명령어로 작동되므로 우리는 CLI인 환경에 익숙해져야 함 → 대표적인 shell은 bash shell .. Computer Science/Basics 2022. 3. 31.
REST API example - Coingecko API 👋 저번 시간에 section에서 REST API에 대해 배운 적이 있다..! Tools for Data Science (from Coursera) 1. Data Scientist's Toolkit [1] Languages of Data Science # Python → by far the most popular programming language for data science → it uses clear, readable syntax. You can do many of the thi.. sh-avid-learner.tistory.com 💪 요약하자면, API중 HTTP 방식으로 client와 web service 간 메세지를 주고 받는 방식을 REST API라고 함. '* Rest API’s func.. Computer Science/Concepts 2022. 3. 30.
Data Science Methodology (from Coursera) - From problem to approach - Q1. What is the problem that you are trying to solve? Q2. How can you use data to answer the question? - Working with the data - Q3. What data do you need to answer the question? Q4. Where is the data coming from (identify all sources) and how will you get it? Q5. Is the data that you collected representative of the problem to be solved? Q6. What additional work is r.. Computer Science/Basics 2022. 3. 27.
Tools for Data Science (from Coursera) 1. Data Scientist's Toolkit [1] Languages of Data Science # Python → by far the most popular programming language for data science → it uses clear, readable syntax. You can do many of the things you are used to doing in other programming languages but with Python you can do it with less code. → a high-level general-purpose programming language that can be applied to many different classes of pro.. Computer Science/Basics 2022. 3. 26.