Computer Science55

🍔stack & queue & deque 🧜‍♀️stack / queue / deque 모두 특정 위치에서만 원소를 넣거나 뺄 수 있는 restricted structure 1. stack 🧜‍♀️ 스택이란, 한 쪽으로만 데이터를 빼고 넣을 수 있는 자료구조로, 한 쪽만 구멍이 뚫려 있는 프링글스 통을 생각하면 된다. 먼저 들어온 데이터가 나중에 나가는 형식 - 즉 나중에 들어온 데이터가 먼저 나가는 형식(선입후출 FILO)의 자료구조. 입구와 출구가 동일한 형태로 매우 간단한 두 연산(원소 추가 O(1), 원소 제거 O(1))이 제공된다. 제일 상단의 원소 확인은 O(1), 제일 상단이 아닌 나머지 원소들의 확인/변경은 원칙적으로 불가능하다. 항상 스택 상단에만 초점이 되어 있음. 따라서 삽입할 때에도 가장 최근에 삽입한 원소 바로 위에 삽입.. Computer Science/Data Structures 2022. 9. 23.
Implementation 1. intro ★ 코딩의 대부분, 즉 머릿속에 있는 알고리즘을 소스코드로 바꾸는 과정 ★ 어떤 알고리즘을 사용하더라도, 최종적으로는 구현을 해야 하기 때문에, 사실 모든 문제가 구현 유형이라고 할 수 있다. ★ 흔히 말하는 '구현' 문제는, 풀이를 떠올리는 건 쉽지만 직접 소스 코드로 옮기기 어려운 문제를 지칭 ① 알고리즘은 간단하나, 코드가 지나칠 만큼 길어지는 문제 (프로그래밍 언어 종류에 따라 어려울 수도, 매우 쉬울 수도 있음) ② 실수 연산을 다루고, 특정 소수점 자리까지 출력해야 하는 문제 ③ 문자열을 특정 기준에 따라서 끊어 처리해야 하는 문제 (python으로 매우 쉽게 풀 수 있는 경우 많고, 대표적으로 난이도 하의 1-2번 문제 위주) ④ 적절한 라이브러리를 찾아서 사용해야 하는 문제.. Computer Science/Algorithms 2022. 9. 21.
Greedy * intro "현재 상황에서 지금 당장 좋은 것만 고르는 방법" → 일반적인 그리디 알고리즘은 문제를 풀기 위한 최소한의 아이디어를 적절히 떠오르면 풀리는 경우 많음 → 단순히 가장 좋아보이는 걸 반복적으로 선택해도 최적의 해를 구할 수 있는 지 검토하게 된다. → 일반적인 상황에서 그리디 알고리즘은 최적의 해를 보장할 수 없는 경우가 많음 → 하지만 코딩 테스트에서의 대부분 그리디 문제는 탐욕법으로 얻은 해가 최적의 해가 되는 상황에서, 추론할 수 있어야 풀리게 출제 ★ 주어진 문제를 모든 상황을 다 고려한 채로, 각 상황의 최적의 결과를 상황별로 계속 모으면, 그 결과가 곧 최적의 결과가 되는 유형이 greedy 유형 ☆ 주의점: 문제의 모든 상황을 생각해야 하고 / 각 상황의 greedy한 솔루션.. Computer Science/Algorithms 2022. 9. 12.
Data Handling 기초적으로 알아야 하는 총 4개의 데이터 타입에 대해서 정확히 알아보고(돌다리 두들기고!) 넘어가자 :) ※ 이런게 있다고 기억하고 추후 정보를 조금씩 추가하는 방식! CSV(Comma Separated Values) 💐 필드를 쉼표로 구분한 텍스트 파일이다. 왜 쉼표로 굳이 분리했냐면, 엑셀 양식의 데이터를 프로그램에 상관없이 쓰기 위해서 데이터 형식으로 만들었다고 보면 된다. 엑셀에서는 '다른 이름 저장' 기능으로 사용 가능하다. notepad로 열면 쉼표로 데이터가 구분되어 표현됨 💐 여기서 text 파일 형태로 데이터 처리 시 문장 내에 들어가 있는 "," 등에 대해 전처리 과정이 필요하다. 파이썬에서는 간단히 CSV 파일을 처리하기 위해 csv 객체를 제공해줌. (+한글로 되어 있다면 별도 한글.. Computer Science/Basics 2022. 7. 15.
feature scaling 👩‍🍳 data를 요리하기 위해 빈번히 해주는 여러 기법들이 있다. 이 기법들을 배워보는 시간을 가지려 한다. feature scaling은 대표적인 방법 중 하나로, data feature별 제각기 다른 범위를 갖고 있음을 파악하고 동일한 범위, 동일한 선상에 맞게 설정해 scaled된 여러 row별 data를 서로 쉽게 비교할 수 있게끔 해준다. scaling을 안한다면, 범위가 더 넓은 variable이 값 자체만으로 상대적으로 다른 variable에 비해 modeling에서 불공평하게 많은 비중을 차지할 수 있어, 해당 문제점을 방지하기 위해 scaling이 권장된다. 👩‍🍳 scaling과 standardization? → scaling은 기존 주어진 value의 range를 바꾸어 다른 분포로.. Computer Science/Basics 2022. 6. 22.
Data Analysis with Python (2/2) (from Coursera) 4) Model Development * A Model = a mathematical equation used to predict a value given one or more other values - Relating one or more independent variables to dependant variables (ex) 'highway-mpg' -> model -> 'predicted price') - the more relevant data have, the more accurate the model is - more data is important - different types of model) simple, multiple, and polynomial regression (1) Simpl.. Computer Science/Basics 2022. 4. 24.
Data Analysis with Python (1/2) (from Coursera) 1. Importing Datasets * Why Data Analysis? - data is everywhere - helps us answers from data - discovering useful info / answering questions / predicting future or the unkown * Understanding the Data - target(label) = the name of the attribute that we want to predict - CSV(Comma Separated Value) file = source of data * Python Packages for DS (1) Scientific Computing Libraries * Pandas) data stru.. Computer Science/Basics 2022. 4. 22.
in where? 🦸‍♀️ - AI examples 1. 제조/IoT 산업 내 AI 혁신과 스마트팩토리 [1] 제조 분야 {1} 스마트팩토리 - 제조 생산을 위한 수직적 통합 및 네트워크화된 제조 시스템을 갖춤 - 제조 공정 및 운영 데이터와 통합 - 오작동모니터링(설비혁신) -> 제품성능모의실험(품질혁신) -> 데이터 기반 의사결정 최적화(운영혁신) 순서로 진행 * 오작동 모니터링 - 기계 설비의 오작동율은 환경(제조율, 습기, 온도 등)에 따라 다름 - 따라서 특정 센터 1-2개만으로 오작동을 예측하기에는 정확도의 한계가 존재 - 다양한 데이터에 기반한 AI를 사용하여 한계 극복, 오작동 시점을 예측 가능 * 제품성능모의실험 (Digital twin) - 실제 공장을 만들어 제품 생산을 테스트하는 데에는 막대한 시간과 비용 소모 - 데이터에 기반한 가.. Computer Science/Basics 2022. 4. 17.
What is Data Science? (from Coursera) 1) Defining Data Science & What Data Scientists Do * What is Data Science? = the field of exploring, manipulating, and analyzing data, and using data to answer questions or make recommendations. → what is NEW? the vast quantity of data available from massively varied sources * the process of data science - many organizations use data science to focus on a specific problem, and so it's essential .. Computer Science/Basics 2022. 4. 13.
Tidy Data * 실제 사용되는 데이터는 하나의 완벽한 dataset이 아닌 여러 개로 쪼개진 경우가 많다! → 따라서 분석하기 용이하게 하나의 dataset으로 만들기 위한 과정이 필요 1. Tidy Data란? "각 변수가 열이고 각 관측치가 행으로 배열된 data (by Hadley Wickham)" - columns에 있던 data를 row로 녹인다고 생각하면 쉬움! - seaborn 시각화할 때 짧은 코드로 가능! (매우 편리) ↓↓↓↓ box plot 시각화할 때 사용한 tidy data 예 살펴보기 ↓↓↓↓ violin plot (+seaborn) * EDA에 대해 알아보았고 EDA 과정에서 많이 쓰이는 시각화 방법 중 box plot에 대해 자세히 알아보았다. box plot (+seaborn) * 저번.. Computer Science/Concepts 2022. 4. 13.
(basic) CLI & 간단 명령어 (linux) & python 가상환경 CLI vs. GUI 🤸🏽 기초지식으로 알아야 할 부분들 정리해보려 한다! 🤸🏽 1> CLI(Command Line Interface) = '글자 기반으로 명령과 결과가 진행되는 환경' * 터미널(terminal) ≫ 글자 기반으로 명령을 전달하는 어플리케이션 → CLI를 통해 shell이 실행됨 (The shell is basically a program that takes your commands from the keyboard and sends them to the operating system to perform) → 운영체제 OS가 작동되게 하는 shell program은 키보드 입력으로 받은 명령어로 작동되므로 우리는 CLI인 환경에 익숙해져야 함 → 대표적인 shell은 bash shell .. Computer Science/Basics 2022. 3. 31.
REST API example - Coingecko API 👋 저번 시간에 section에서 REST API에 대해 배운 적이 있다..! Tools for Data Science (from Coursera) 1. Data Scientist's Toolkit [1] Languages of Data Science # Python → by far the most popular programming language for data science → it uses clear, readable syntax. You can do many of the thi.. sh-avid-learner.tistory.com 💪 요약하자면, API중 HTTP 방식으로 client와 web service 간 메세지를 주고 받는 방식을 REST API라고 함. '* Rest API’s func.. Computer Science/Concepts 2022. 3. 30.