열린 소프트웨어 이야기

책 “오늘날 우리는 컴퓨터라 부른다” 소개 만화

책읽기2024. 1. 16. 14:05

지난 여름에 인사이트 출판사 의뢰로 그렸던 “오늘날 우리는 컴퓨터라 부른다” 소개 만화를 이제야 공유해봅니다. 제가 트위터에 본격적으로 여기 만화에 소개한 컴퓨터에 대한 역사를 연재하고 있었는데, 그 트위터를 보고 출판사에서 연락이 와서 우연한 기회이 이 만화를 그렸습니다. 우선 제가 만화를 그리는데 참고한 책의 번역본 이라서 반가웠고, 당시 전체를 다 읽어보지는 않고 필요한 부분만 읽어봤었는데, 이번 만화를 그리면서 전체를 다 읽을 수 있었습니다.

나름 제 이름을 걸고 공개되는 만화라 열심히 그렸습니다. 공개된 만화는 사실 버전2고 좀더 길고 설명이 많은 버전1이 있습니다. 기회가 되면 버전1을 다시 정리해서 올려볼까 합니다. 기회가 되시면 “오늘날 우리는 컴퓨터라 부른다“를 꼭 읽어보세요. 컴퓨터라는 개념이 나오기까지 수학자들이 어떤 노력을 했는지 한눈에 살펴볼 수 있습니다.

'책읽기' 카테고리의 다른 글

작은 과제로 프로그래밍 배우기 (0)	2023.08.18
웹이후의 세계를 읽고... (2)	2009.10.11
"대화" 리영희 (2)	2009.01.27
자바스크립트 for 2.0 & Learning JavaScript (2)	2007.06.14
해커와 화가 (3)	2006.07.17

DeepMind가 공개한 생성형 AI를 이용한 ALOHA 로봇 시연 영상

AI2024. 1. 14. 12:50

새로운 개념의 비교적 저렴한 가정용/산업용 로봇이 나올 것 같다. 기존의 로봇은 규칙 기반의 로봇이었지만, 이제는 생성형 인공지능을 이용하여 사람의 행위를 학습하고 모방하는 로봇이 등장했다. 이 로봇들은 청소부터 요리까지 사람이 가르쳐 준 대로 모방하여 작업을 수행한다. 특히 눈에 띄는 점은 이러한 학습 데이터를 로봇들 간에 공유할 수 있다는 것이다.

좀 더 자세한 정보와 영상으로 아래 홈페이지에서 확인할 수 있다.

https://mobile-aloha.github.io/

Mobile ALOHA: Learning Bimanual Mobile Manipulation with Low-Cost Whole-Body Teleoperation

by Zipeng Fu*, Tony Z. Zhao* and Chelsea Finn at Stanford

mobile-aloha.github.io

'AI' 카테고리의 다른 글

Code LLaMa를 이용해서 GIT 커밋 메시지 자동 작성하기 (1)	2024.01.28
Ollama: 내 컴퓨터에 설치하는 생성형 AI 서비스 (1)	2024.01.28
Llama-cpp로 Code LlaMa 실행하기 (1)	2024.01.24
CUDA를 이용한 LlaMa2사용하기 (0)	2024.01.18
LLaMa(Alpaca-LoRa)를 이용한 나만의 ChatGPT 만들기 (1)	2023.09.04

스킨 변경

카테고리 없음2023. 9. 12. 16:24

우연히 수학관련 정보를 찾다가 티스토리 스킨을 발견했다.
https://chocobear.tistory.com/

2!=2

대학교 새내기인 친구들끼리 운영하는 팀블로그입니다.

chocobear.tistory.com

https://m1story.tistory.com/161

엠원스킨 :: 엠원리액트 (M1react) 반응형 스킨 다운로드

엠원스킨의 반응형 스킨, 앰원리액트 (M1react) 스킨입니다. 반응형으로 설계가 되었습니다. 빠른 로딩속도와 깔끔함이 장점인 스킨입니다. 아래 사진은 PC에서 볼 때의 모습이며 심플하고 일체감

m1story.tistory.com

약간 튜닝을 거쳐서 현재 상태로 만들어봤다.

LLaMa(Alpaca-LoRa)를 이용한 나만의 ChatGPT 만들기

AI2023. 9. 4. 15:08

그동한 Meta가 공개한 LLama1를 fine-tuning 한 것을 정리보려 합니다. LLama2가 이미 나오긴 했지만, 아직 LLama2에 대한 Apaca-Lora가 LLama2를 지원하지 않아서 전에 해본 내용을 정리해보았습니다.

OpenAI API가 비용이 드니까 특정 용도로만 쓴다면 ChatGPT를 이용해서 dataset를 생성하고 LLama를 이용해서 로컬에서 fine-tuning해서 사용하면 질은 약간 떨어져 비용면에서 유리하지 않을까 하는 생각에 시도를 해봤습니다.

아시다시피 Meta에서 LLMA (7B, 13B, 33B, 65B) 모델을 공개했습니다. 상업적 용도 외에는 마음대로 사용할 수 있어서 이때 부터 엄청난 뉴스를 쏟아져나왔고, LLaMa2까지도 공개를 했습니다.

아래 글을 참고하세요.
https://arstechnica.com/information-technology/2023/03/you-can-now-run-a-gpt-3-level-ai-model-on-your-laptop-phone-and-raspberry-pi/

그중에 스탠포드 학생들이 만든 Alpaca는 LLaMa를 기반으로 fine-tuning하는 방법을 제공했습니다.
https://crfm.stanford.edu/2023/03/13/alpaca.html

Alpaca는 52K data set를 제공하는데, GPT의 text-davinci-003 모델을 이용해 자동 생성했다고 합니다. 그런데, Nvidia A100정도의 GPU가 필요했습니다. 그런데, LoRA를 적용해서 게이밍 GPU에서도 fine-tuning할 방법이 나왔지요.
https://github.com/tatsu-lab/stanford_alpaca

그것이 바로 Alpaca-LoRa이고 제가 fine-tuning에 성공한 모델이기 합니다.

Fine-tuning

Fine-tuning은 기계 학습에서 미리 훈련된 모델을 특정 작업이나 데이터에 맞게 조정하는 과정을 의미합니다. 대규모 언어 모델(예: GPT )을 사용할 때, 특정 작업 또는 도메인에 더 적합하게 만들어야 할 필요가 있습니다. 이때 fine-tuning이 사용됩니다.

GPT → ChatGPT (Fine-tuning)

LoRa

LoRa에 대해 Bard에게 물어보니 아래와 같이 알려주네요

---------------

LoRA(Low-rank Adaptation)는 비지도 학습 기반의 적응 알고리즘으로, 딥러닝 모델을 새로운 데이터 세트에 적응시키는 데 사용됩니다. LoRA는 모델의 가중치를 낮은 차원의 표현으로 축소한 다음, 새로운 데이터 세트에 맞게 재구성합니다. LoRA는 모델의 복잡성을 줄이고 새로운 데이터 세트에 대한 일반화 성능을 향상시킬 수 있습니다.

LoRA는 다음과 같은 단계로 구현됩니다.

모델의 가중치를 낮은 차원의 표현으로 축소합니다.
새로운 데이터 세트에 대한 손실 함수를 계산합니다.
손실 함수를 최소화하는 방향으로 모델의 가중치를 재구성합니다.

LoRA는 다양한 데이터 세트에서 효과적으로 작동하는 것으로 나타났습니다. 예를 들어, LoRA는 이미지 인식, 자연어 처리, 음성 인식 등 다양한 분야에서 성능을 향상시킨 것으로 나타났습니다.

LoRA는 딥러닝 모델을 새로운 데이터 세트에 적응시키는 데 유용한 도구입니다. LoRA는 모델의 복잡성을 줄이고 새로운 데이터 세트에 대한 일반화 성능을 향상시킬 수 있습니다.

----------------

LoRa에 대한 자세한 설명: https://devocean.sk.com/blog/techBoardDetail.do?ID=164779&boardType=techBlog

LoRa덕분에 Nvidia 4090에서 fine-tuning 이 가능해졌습니다. 이제 우분투 22.04에서 Alpaca-Lora를 이용해 Nvidia 4090으로 fine-tuning을 해보겠습니다.

NVidia Driver 설치

우선 우분투22 .04에 NVidia Driver를 설치합니다.

https://www.nvidia.com/download/index.aspx

매달 업데이트 되는 듯 보이니, 자주 업데이트를 하세요.

“You appear to be running an X server; please exit X before installing”

위와 같은 에러 메시가 나오면 현재 x-server나와서 weston로 다시 로그인해서 설치를 합니다.

Python & Pytorch 설치

이제, Python을 설치합니다.

$ sudo apt install python3-pip
$ sudo apt install python3-venv
$ python -m venv env
$ source env/bin/activate

Pytorch를 설치합니다.참고 저는 CUDA 11.7에 맞는 2.0.1을 설치했습니다.

https://pytorch.org/get-started/locally/

아래 코드를 실행해서 GPU Driver, CUDA, Pytorch가 제대로 설치되었는 확인합니다.

import torch

# Check if CUDA is available
if torch.cuda.is_available():
	print("CUDA is available.")
	# Print the CUDA device count
	print(f"Number of CUDA devices: {torch.cuda.device_count()}")
	# Print the name of the current CUDA device
	print(f"Current CUDA device name: {torch.cuda.get_device_name(torch.cuda.current_device())}")
else:
	print("CUDA is not available.")

print("pytorch version")
print(torch.__version__)

$ python cuda.py
CUDA is available.
Number of CUDA devices: 1
Current CUDA device name: NVIDIA GeForce RTX 4090
pytorch version
2.0.1+cu117

alpaca-lora 설치

$ git clone https://github.com/tloen/alpaca-lora.git
$ cd alpaca-lora
$ pip install -r requirements.txt

Fine-tuning

설치 끝나면 GPT4에서 새롭게 생성한 dataset으로 13b 모델을 fine-tuning을 해보겠습니다.

$ python3 finetune.py --base_model 'yahma/llama-13b-hf' --data_path alphca_data_gpt4.json --output_dir './lora-alpaca-13b'

base model로 아래와 같은 이유로 decapoda-research/llama-7b-hf 대신 yahma/llama-13b-hf를 사용했습니다.

https://github.com/tloen/alpaca-lora/issues/279#issuecomment-1500906791

Inference

fine-tuning할때 입력한 output_dir를 --lora_weight에 입력합니다.

$ python3 generate.py --load_8bit --base_model 'yahma/llama-13b-hf' --lora_weights ./lora-alpaca-13b

Running on local URL: http://0.0.0.0:7860

위 링크를 열면 테스트를 해봅니다.

Test

Instruction: tell me about Bill Gates

Max tokens: 128

Bill Gates is an American business magnate, investor, author, philanthropist, and humanitarian. Gates is the former CEO and current chairman of Microsoft, the software company he founded with Paul Allen. He is consistently ranked among the world's wealthiest people and was the wealthiest overall from 1995 to 2009, excluding 2008, when he was ranked third. During his career at Microsoft, Gates held the positions of CEO and chief software architect, and he remains the largest individual shareholder with more than 6 percent of

Max tokens: 300

Bill Gates is an American business magnate, investor, author, philanthropist, and humanitarian. Gates is the former CEO and current chairman of Microsoft, the software company he founded with Paul Allen. He is consistently ranked among the world's wealthiest people and was the wealthiest overall from 1995 to 2007, excluding 2008, when he was ranked third. During his career at Microsoft, Gates held the positions of CEO and chief software architect, and he remains the largest individual shareholder, with more than 6 percent of the common stock. He has also authored or co-authored several books.

Gates is one of the best-known entrepreneurs of the personal computer revolution. He has been criticized for his business tactics, which have been considered anti-competitive, an opinion that has in some cases been upheld by numerous court rulings. Later in his career Gates pursued a number of philanthropic endeavors, donating large amounts of money to various charitable organizations and scientific research programs through the Bill & Melinda Gates Fou128ndation, established in 2000.

Gates stepped down as chief executive officer of Microsoft in January 2000. He remained as chairman and created the position of chief software architect for himself. In June 2006, G

Max tokens에 따라 Output 길이가 달라집니다. GPU mermoy한계 때문에 Max Token은 계속 늘릴 수는 없습니다.

간단한 테스트를 해보았습니다.

Instruction: 1+1
output:
2
\end{code}</s>

Instruction: Write a Python program that prints the first 10 Fibonacci numbers.
output:

\begin{code}
def fibonacci(n):
	if n == 0:
    	return 0
	elif n == 1:
    	return 1
	else:
    	return fibonacci(n-1) + fibonacci(n-2)

for i in range(10):
	print(fibonacci(i))
\end{code}

Answer: \begin{code}
def fibonacci(n):
	if n == 0:
    	return 0
	elif n == 1

코드는 잘 작성했는데, 반복 되는 문제가 있네요. 아마 Max tokens값이 커서 그런 것 같습니다. 잘은 동작하는데, 결과가 나오기 까지 길게는 10초 이상의 시간이 걸리기도 합니다. ChatGPT나 Bard는 빠르게 응답 결과가 나오는데, 어떻게 상용 서비스를 하는지 궁금하네요.

이상입니다~

'AI' 카테고리의 다른 글

Code LLaMa를 이용해서 GIT 커밋 메시지 자동 작성하기 (1)	2024.01.28
Ollama: 내 컴퓨터에 설치하는 생성형 AI 서비스 (1)	2024.01.28
Llama-cpp로 Code LlaMa 실행하기 (1)	2024.01.24
CUDA를 이용한 LlaMa2사용하기 (0)	2024.01.18
DeepMind가 공개한 생성형 AI를 이용한 ALOHA 로봇 시연 영상 (1)	2024.01.14

작은 과제로 프로그래밍 배우기

책읽기2023. 8. 18. 16:44

https://ebook.insightbook.co.kr/book/45

코딩 트레이닝 - 도서출판 인사이트

문제 해결의 기본기를 강화하는 57개의 연습문제! 『코딩 트레이닝』(Exercises for Programmers)은 현...

ebook.insightbook.co.kr

코딩 트레이닝은 인사이트에서 나온 책인데, 처음 프로그래밍 언어를 배울때 참고하면 좋은 것 같다. 프로그래밍 언어는 배우기 보다 계속 머릿속에 기억하고 있는게 어렵다. 주력으로 사용하는 언어는 괜찮은데, 가끔 쓰는 파이썬 같은 경우 몇 달 안쓰면 문법을 금새 잊곤한다. 이런 경우를 대비해서 평소해도 꾸준히 코드도 보고 코딩도 해야 하는데, 기존 코딩 테스트에 나오는 알고리즘은 문제는 그렇게 실용적이지 않지만 이런식으로 작은 과제를 풀어보면 나중에 현업에서 도움이 될 수 있다.

아래 블로그에서는 메가 프로젝트 리스트도 소개하니 참고하면 좋을 듯

https://jhrogue.blogspot.com/2017/10/b.html

"보너스: 이 책에서 다루는 프로젝트보다 조금 더 어려운 프로젝트가 필요하면 Mega Project List(A list of practical projects that anyone can solve in any programming language.)를 참조하면 좋겠다"

'책읽기' 카테고리의 다른 글

책 “오늘날 우리는 컴퓨터라 부른다” 소개 만화 (0)	2024.01.16
웹이후의 세계를 읽고... (2)	2009.10.11
"대화" 리영희 (2)	2009.01.27
자바스크립트 for 2.0 & Learning JavaScript (2)	2007.06.14
해커와 화가 (3)	2006.07.17

headless 브라우저 감지 회피하기

Web2023. 6. 9. 05:41

Puppeteer나 Playwright같은 headless 브라우징으로 웹페이지 scaping하는 경우가 많은데, 많은 웹사이트들이 headless브라우저를 감지하고 접근을 차단하고 있다. 이를 어떻게 회피하는지 알아보자.

우선 아래 페이지를 headless 브라우저로 접근하면 일반적인 웹브라우저와 headless브라우저가 어떻게 다른 결과가 나오는지 알 수 있다.

https://infosimples.github.io/detect-headless/

사실 이것말고도 더 많은 방법이 있지만, 이 정도가 알려져있다. 이런 것들을 쉽게 구현해주는 Puppeteer plug-in이 이미 만들어져있다.

https://www.npmjs.com/package/puppeteer-extra-plugin-stealth

reCAPCHA도 대응가능하다.

상용 Proxy 서버 사용

당연히 IP도 체크하므로 상용 Proxy 서버를 사용하는 것이 좋다. 상용 서비스는 Proxy 서버를 rotation해서 여러 IP를 사용하도록 해준다.

사실, 창과 방패의 싸움이라 clludflare같은 회사에서는 headless 브라우저를 잘 감지한다. 가장 확실한 방법은 상용 Proxy server와 함께 사용하는 것이다. 비용은 들지만, 가장 확실한 방법이기도 하다.

'Web' 카테고리의 다른 글

Microsoft가 Electron을 버린 이유 (0)	2024.01.27
Edge WebView2로 나만의 웹브라우저 만들기 (0)	2024.01.27
Web fonts로 인한 layout 변경 문제 (0)	2023.03.18
타입스크립트(Typescript) 스타터 코드 (0)	2022.09.04
웹엔진 Electron, NW.js, CEF, Qt WebEngine 에 관하여.. (0)	2021.06.09

Web fonts로 인한 layout 변경 문제

Web2023. 3. 18. 04:01

https://simonhearne.com/2021/layout-shifts-webfonts/

How to avoid layout shifts caused by web fonts

One of the biggest causes of layout shifts for my clients is late-loading web fonts, let's look at how to optimise them!

simonhearne.com

많은 웹사이트가 웹폰트를 쓰고 있다. 시스템 폰트 보다 본래 웹페이지 디자인에 맞는 폰트로 웹페이지를 출력하고 싶은 사람들이 많기 때문에 웹폰트 사용이 증가하고 있다. 그런데, 웹폰트는 다운로드 받아야하므로 크기가 큰 경우 웹페이지가 먼저 렌더링되는 경우가 있다. 이럴 때, 레이아웃이 출렁거리는 것을 느낄 수 있다. 웹폰트를 다 받으면 시스템 폰트로 그린 페이지를 다시 그리기 때문이다.

위 사이트에서는 그러한 문제를 잘 설명했고, 어떻게 해결할 수 있는지 소개하고 있다..

In summary we need to prevent the layout shift by letting the browser render in a fallback system font if it doesn't get the web font in time, then optimise our fonts to try to get them to the browser before it needs them:

use font-display: optional to prevent layout shifts
subset fonts and serve as woff2
use variable fonts or a limited set of weight variations
preload critical fonts
host your own fonts on your main domain

'Web' 카테고리의 다른 글

Edge WebView2로 나만의 웹브라우저 만들기 (0)	2024.01.27
headless 브라우저 감지 회피하기 (0)	2023.06.09
타입스크립트(Typescript) 스타터 코드 (0)	2022.09.04
웹엔진 Electron, NW.js, CEF, Qt WebEngine 에 관하여.. (0)	2021.06.09
Crosswalk을 소개한 블로그글 (0)	2016.03.31

Xerox Star vs. Apple Lisa

기타2022. 10. 31. 05:29

https://www.youtube.com/watch?v=pBiWtJJN5zk

Apple Lisa 컴퓨터는 스티브 잡스가 제록스 팔로알토 연구소를 방문하여 Xerox Star라는 컴퓨터를 본 후, 본 따 만든 컴퓨터입니다. 애플 컴퓨터로는 처음으로 GUI를 도입하는 등 혁신적인 컴퓨터였지만, 너무 비싼 가격 때문에 시장에서는 실패합니다. 참고로 리사는 스티브 잡스 딸의 이름입니다.

'기타' 카테고리의 다른 글

구글 픽셀 8 Pro 박스 개봉 및 간단 리뷰 (0)	2024.02.03
아치 리눅스( Arch Linux) 패키지 관리 (0)	2021.04.29
Code Reading 남들이 짠 코드 읽기... (0)	2018.05.06
스티브 잡스의 죽음을 애도하며.. (0)	2011.10.06
우리에게 이야기가 없는 이유 (4)	2010.08.20

전체 글에 해당하는 글 269건

책 “오늘날 우리는 컴퓨터라 부른다” 소개 만화

'책읽기' 카테고리의 다른 글

DeepMind가 공개한 생성형 AI를 이용한 ALOHA 로봇 시연 영상

'AI' 카테고리의 다른 글

스킨 변경

LLaMa(Alpaca-LoRa)를 이용한 나만의 ChatGPT 만들기

Fine-tuning

LoRa

NVidia Driver 설치

Python & Pytorch 설치

alpaca-lora 설치

Fine-tuning

Inference

Test

Max tokens: 128

Max tokens: 300

'AI' 카테고리의 다른 글

작은 과제로 프로그래밍 배우기

'책읽기' 카테고리의 다른 글

headless 브라우저 감지 회피하기

상용 Proxy 서버 사용

'Web' 카테고리의 다른 글

Web fonts로 인한 layout 변경 문제

'Web' 카테고리의 다른 글

Xerox Star vs. Apple Lisa

'기타' 카테고리의 다른 글

최근 글

최근 월별 글

최근 댓글

최근 글

최근 월별 글

최근 댓글

최근 글

최근 월별 글

최근 댓글

지난달

2025.6

다음달

티스토리툴바

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30