Agenti AI se pomalu stávají věcí, ale mnoho lidí si neuvědomuje, jak s nimi začít, zejména jak připojit agenta AI s jejich prohlížečem a provádět různé úkoly, jako je automatizace, škrábání na webu, testování a další. Aby vám to pomohlo, zavolal report GitHub Použití prohlížeče Poskytuje jeden z nejjednodušších způsobů, jak propojit agenty AI s prohlížečem.
Co je používání prohlížeče?
Použití prohlížeče je knihovna Python s otevřeným zdrojovým kódem, která umožňuje agentům AI navigovat webové stránky, extrahovat data a automatizovat interakce. Podporuje mechanismy pro správu více tebů, sledování prvků a samopraví Integrace s LLMS Stejně jako GPT-4 a Claude 3 pro bezproblémovou automatizaci prohlížeče řízeného AI.
Jak používat prohlížeč používat WebUI na Windows 11/10?
Před použitím používání prohlížeče se ujistěte, že máte klíč API z preferovaného modelu LLM, jako je OpenAI, Anthropic, DeepSeek atd. Bez klíče API nebudete moci úložiště používat. Jakmile to máte, postupujte podle níže uvedených kroků:
1] Začínáme
- Nejprve začněte instalací Pythonova nejnovější verze z jeho oficiálních webových stránek.
- Budete také muset Stáhněte si a nainstalujte git .
- Dále přejděte na vyhledávání Windows, zadejte CMD, klikněte na něj a otevřete se jako admin.
- V CMD spusťte následující příkaz, abyste klonovali úložiště:
2] Vytvoření virtuálního prostředí
Dalším krokem by bylo vytvoření virtuálního prostředí. V CMD tedy spusťte následující příkazy:
3F3078B6BD8920ED955A6FADB5E6667919A754Avenv\Scripts\activate
3] Nainstalujte závislosti
Dále budete muset nainstalovat potřebné závislosti. Za tímto účelem spusťte následující příkaz a chvíli počkejte:
pip install -r requirements.txt
Číst: Jak nainstalovat Python do Windows
4] Nainstalujte dramatik
Playwright je knihovna automatizace prohlížeče používaného pomocí prohlížeče. Chcete -li jej nainstalovat, spusťte příkaz:
playwright install
5] Použití spuštění prohlížeče
Jakmile jste nainstalovali vše, je čas zahájit svůj projekt. Takže v příkazovém řádku spusťte následující příkaz:
kompaktní datový soubor aplikace Outlook
python webui.py --ip 127.0.0.1 --port 7788
Po spuštění příkazu počkejte na okamžik a uvidíte URL s IP adresou na obrazovce. Jednoduše jej zkopírujte a vložte do adresního řádku prohlížeče, nebo můžete použít tuto adresu URL: http://127.0.0.1:7788/ .
6] Konfigurace a spuštění používání prohlížeče
Z prohlížeče použijte řídicí panel, budete muset nakonfigurovat svůj Máte agenta nástroj.
- Nejprve klikněte na Nastavení LLM . Odtud vyberte svého poskytovatele LLM, název modelu, základní URL a klíč API.
- Dále jděte Nastavení agenta a nakonfigurujte typ agenta, maximální kroky spuštění, akce na krok a další nastavení. To samé je třeba udělat pro Nastavení prohlížeče (Nakonfigurujte tato nastavení podle vašich požadavků).
- Nakonec jděte na Spusťte agent , Zadejte popis úlohy a další informace a kliknutím na tlačítko spusťte agent spusťte jej.
Takto tedy můžete používat používání prohlížeče. Je to skvělý nástroj pro extrakci interaktivních prvků, provádění hlubokého výzkumu, automatizaci pracovních postupů a dalších. Jděte do toho a zkuste to sami, abyste viděli, jak to pro vás funguje.
Mohu použít použití prohlížeče bez klíče API?
Pro použití používání prohlížeče je vyžadován klíč API od poskytovatele LLM (jako je OpenAI, Antropic nebo Deepseek). Bez něj nebude agent AI schopen zpracovat úkoly nebo efektivně interagovat s webovými stránkami.
Používá prohlížeč podporující bezhlavé prohlížení?
Prohlížeč používá páky Playwright, který podporuje bezhlavé prohlížení. To znamená, že můžete automatizovat úkoly bez otevření viditelného okna prohlížeče, takže je ideální pro škrábání, testování a automatizaci v prostředích serveru.