Computer Science/Basics11

jupyter notebook markdown *수시 업데이트 🫰 markdown에서 유용하다고 생각하는 부분 문법 내용 수시로 업데이트 🫰 ★ font color / 형광펜 ★ red green This is a green colored box This is a red colored box This is a yellow colored box This is a blue colored box ★ 하이퍼링크 ★ [Google](https://www.google.com/) ★ LaTex 수학 문법 ★ → $ 양쪽에 두 개는 가운데 정렬 → $ 양쪽에 한 개는 왼쪽 정렬 ※ latex 여러 기호 참조 (지속적 update) ※ 🧜🏻‍♂️ LaTex Grammers compilation * 까먹지 않으려고 모아둠 🌟 ⭐️ 분수 쓰기 (A 분자, B 분모) ⭐️ \cfrac{.. Computer Science/Basics 2023. 2. 7.
Data Handling 기초적으로 알아야 하는 총 4개의 데이터 타입에 대해서 정확히 알아보고(돌다리 두들기고!) 넘어가자 :) ※ 이런게 있다고 기억하고 추후 정보를 조금씩 추가하는 방식! CSV(Comma Separated Values) 💐 필드를 쉼표로 구분한 텍스트 파일이다. 왜 쉼표로 굳이 분리했냐면, 엑셀 양식의 데이터를 프로그램에 상관없이 쓰기 위해서 데이터 형식으로 만들었다고 보면 된다. 엑셀에서는 '다른 이름 저장' 기능으로 사용 가능하다. notepad로 열면 쉼표로 데이터가 구분되어 표현됨 💐 여기서 text 파일 형태로 데이터 처리 시 문장 내에 들어가 있는 "," 등에 대해 전처리 과정이 필요하다. 파이썬에서는 간단히 CSV 파일을 처리하기 위해 csv 객체를 제공해줌. (+한글로 되어 있다면 별도 한글.. Computer Science/Basics 2022. 7. 15.
feature scaling 👩‍🍳 data를 요리하기 위해 빈번히 해주는 여러 기법들이 있다. 이 기법들을 배워보는 시간을 가지려 한다. feature scaling은 대표적인 방법 중 하나로, data feature별 제각기 다른 범위를 갖고 있음을 파악하고 동일한 범위, 동일한 선상에 맞게 설정해 scaled된 여러 row별 data를 서로 쉽게 비교할 수 있게끔 해준다. scaling을 안한다면, 범위가 더 넓은 variable이 값 자체만으로 상대적으로 다른 variable에 비해 modeling에서 불공평하게 많은 비중을 차지할 수 있어, 해당 문제점을 방지하기 위해 scaling이 권장된다. 👩‍🍳 scaling과 standardization? → scaling은 기존 주어진 value의 range를 바꾸어 다른 분포로.. Computer Science/Basics 2022. 6. 22.
Data Analysis with Python (2/2) (from Coursera) 4) Model Development * A Model = a mathematical equation used to predict a value given one or more other values - Relating one or more independent variables to dependant variables (ex) 'highway-mpg' -> model -> 'predicted price') - the more relevant data have, the more accurate the model is - more data is important - different types of model) simple, multiple, and polynomial regression (1) Simpl.. Computer Science/Basics 2022. 4. 24.
Data Analysis with Python (1/2) (from Coursera) 1. Importing Datasets * Why Data Analysis? - data is everywhere - helps us answers from data - discovering useful info / answering questions / predicting future or the unkown * Understanding the Data - target(label) = the name of the attribute that we want to predict - CSV(Comma Separated Value) file = source of data * Python Packages for DS (1) Scientific Computing Libraries * Pandas) data stru.. Computer Science/Basics 2022. 4. 22.
in where? 🦸‍♀️ - AI examples 1. 제조/IoT 산업 내 AI 혁신과 스마트팩토리 [1] 제조 분야 {1} 스마트팩토리 - 제조 생산을 위한 수직적 통합 및 네트워크화된 제조 시스템을 갖춤 - 제조 공정 및 운영 데이터와 통합 - 오작동모니터링(설비혁신) -> 제품성능모의실험(품질혁신) -> 데이터 기반 의사결정 최적화(운영혁신) 순서로 진행 * 오작동 모니터링 - 기계 설비의 오작동율은 환경(제조율, 습기, 온도 등)에 따라 다름 - 따라서 특정 센터 1-2개만으로 오작동을 예측하기에는 정확도의 한계가 존재 - 다양한 데이터에 기반한 AI를 사용하여 한계 극복, 오작동 시점을 예측 가능 * 제품성능모의실험 (Digital twin) - 실제 공장을 만들어 제품 생산을 테스트하는 데에는 막대한 시간과 비용 소모 - 데이터에 기반한 가.. Computer Science/Basics 2022. 4. 17.
What is Data Science? (from Coursera) 1) Defining Data Science & What Data Scientists Do * What is Data Science? = the field of exploring, manipulating, and analyzing data, and using data to answer questions or make recommendations. → what is NEW? the vast quantity of data available from massively varied sources * the process of data science - many organizations use data science to focus on a specific problem, and so it's essential .. Computer Science/Basics 2022. 4. 13.
(basic) CLI & 간단 명령어 (linux) & python 가상환경 CLI vs. GUI 🤸🏽 기초지식으로 알아야 할 부분들 정리해보려 한다! 🤸🏽 1> CLI(Command Line Interface) = '글자 기반으로 명령과 결과가 진행되는 환경' * 터미널(terminal) ≫ 글자 기반으로 명령을 전달하는 어플리케이션 → CLI를 통해 shell이 실행됨 (The shell is basically a program that takes your commands from the keyboard and sends them to the operating system to perform) → 운영체제 OS가 작동되게 하는 shell program은 키보드 입력으로 받은 명령어로 작동되므로 우리는 CLI인 환경에 익숙해져야 함 → 대표적인 shell은 bash shell .. Computer Science/Basics 2022. 3. 31.
Data Science Methodology (from Coursera) - From problem to approach - Q1. What is the problem that you are trying to solve? Q2. How can you use data to answer the question? - Working with the data - Q3. What data do you need to answer the question? Q4. Where is the data coming from (identify all sources) and how will you get it? Q5. Is the data that you collected representative of the problem to be solved? Q6. What additional work is r.. Computer Science/Basics 2022. 3. 27.
Tools for Data Science (from Coursera) 1. Data Scientist's Toolkit [1] Languages of Data Science # Python → by far the most popular programming language for data science → it uses clear, readable syntax. You can do many of the things you are used to doing in other programming languages but with Python you can do it with less code. → a high-level general-purpose programming language that can be applied to many different classes of pro.. Computer Science/Basics 2022. 3. 26.
data 분석 개요 & (1) 문제 정의, (2) 수집 1. 데이터 분석 및 개요 = 저장된 데이터에서 의미 있는 정보를 얻기 위한 과정 Q) 데이터 분석의 목표? = 데이터 분석을 통해 데이터를 활용함으로써 경제적 가치를 창출하는 것! [1] 데이터 활용 사례 * 미국 T-mobile 사 - 미국 내 휴대폰 통신 사업자를 대상으로 통화패턴을 분석하여 이탈고객을 방지한 사례 * sensor 데이터 관리 사례 - volvo 신차의 운행 과정에서 발생하는 각종 sensor 데이터 활용 : 해당 데이터를 활용함으로서 제품개발에서 찾기 어려운 결함 & 고객의 요구를 분석 - 과거에는 50만대의 차량이 팔린 후 알 수 있던 결함을 단지 1,000대 판매 시점에 바로 포착 - 결국 대규모 리콜 상태를 방지함으로서 비용을 절감할 수 있었다. [2] 데이터 분석의 역할 *.. Computer Science/Basics 2022. 3. 23.