• 多核异构模式下有管理的共享内存设计方法

    随着嵌入式系统、高性能计算和物联网技术的飞速发展,多核异构处理器已经成为当前计算平台的重要组成部分。多核异构处理器通过集成多种类型的处理器核心(如高性能CPU核心、GPU核心、NPU核心等),能够同时满足高性能计算和节能降耗的需求。然而,多核异构处理器的设计也带来了新的挑战,尤其是在内存管理和数据同步方面。本文将探讨多核异构模式下有管理的共享内存设计方法,以实现高效的数据交换和同步,提升系统整体性能。

  • 适用FPGA的小型神经网络:加速边缘智能的新篇章

    在人工智能(AI)技术日新月异的今天,神经网络作为其核心驱动力,正逐步渗透到各个行业与领域。然而,传统的神经网络模型往往受限于计算资源和功耗,难以在边缘设备上实现高效运行。现场可编程门阵列(FPGA)作为一种高性能、低功耗的硬件加速器,为小型神经网络的部署提供了理想的平台。本文将深入探讨适用于FPGA的小型神经网络,以及它们在边缘智能应用中的独特优势。

  • 使用PYNQ训练和实现二值神经网络(BNN):加速边缘智能的新途径

    在人工智能(AI)的浪潮中,深度学习模型正逐渐渗透到各个行业和领域。然而,传统的深度学习模型通常计算量大、功耗高,难以在资源受限的边缘设备上实现高效运行。为了解决这一问题,二值神经网络(BNN)应运而生。BNN通过将权重和激活值二值化(即取值为+1或-1),极大地降低了计算复杂度和功耗,使其更适合在边缘设备上部署。本文将介绍如何使用PYNQ平台来训练和实现BNN,并附上相关代码示例。

    智能应用
    2024-10-24
    PYNQ BNN
  • CCIX在高速缓存一致性主机到FPGA接口中的应用评估

    随着数据中心、云计算和大数据等领域的快速发展,对高性能计算和异构计算的需求日益增长。在这样的背景下,缓存一致性互联标准CCIX(Cache Coherent Interconnect for Accelerators)逐渐成为连接主机处理器(如CPU)和加速器设备(如FPGA)的关键技术。本文旨在评估CCIX在构建高速缓存一致性主机到FPGA接口中的应用,探讨其优势、挑战,并提供相关代码示例。

  • 使用机器学习预测FPGA的执行时间与功耗:一种创新的方法

    随着科技的飞速发展,现场可编程门阵列(FPGA)在高性能计算、数据中心、人工智能等领域的应用日益广泛。然而,FPGA设计的复杂性和功耗问题一直是制约其性能提升的关键因素。近年来,机器学习(ML)技术的兴起为FPGA的执行时间与功耗预测提供了新的解决方案。本文将探讨如何使用机器学习进行FPGA的执行时间与功耗预测,并分析其优势与挑战。

  • 在MCU端部署GRU模型实现鼾声检测:科技与健康管理的融合

    随着人工智能技术的快速发展,深度学习模型在各个领域的应用日益广泛。特别是在医疗健康领域,深度学习模型的引入为疾病的早期检测、持续监测和健康管理提供了全新的解决方案。鼾声检测作为睡眠呼吸障碍监测的重要一环,也受益于深度学习技术的发展。本文将探讨在微控制器单元(MCU)端部署门控循环单元(GRU)模型实现鼾声检测的技术背景、实现方法及其潜在应用。

  • PIC64GX MPU 面向智能边缘计算应用

    智慧城市、远程监控、自动驾驶汽车和智能视觉等多种应用对智能边缘计算的需求正在不断增加。在本文中,我们重点介绍 Microchip Technology 全新 PIC64GX 系列 64 位微处理器的一些功能。

    智能应用
    2024-10-20
    MPU PIC64GX
  • 利用光伏能源驱动无电池物联网

    随着物联网(IoT)技术的快速发展,越来越多的设备连接到网络中,使得我们的生活和工作变得更加智能化和便捷。然而,传统物联网设备大多依赖电池供电,这不仅增加了维护成本,还对环境造成了不小的负担。近年来,利用光伏能源驱动无电池物联网的概念逐渐兴起,为解决这一问题提供了新的思路。本文将探讨光伏能源在无电池物联网中的应用、优势、挑战以及未来的发展方向。

  • 企业生成式 AI 应用的架构模式:DSFT、RAG、RAFT 和 GraphRAG

    最佳设计的企业架构是任何组织 IT 系统的支柱,它支持实现组织业务目标的基础构建块。架构包括最佳实践、明确概述的策略、通用框架和指导方针,供工程团队和其他利益相关者选择正确的工具来完成任务。企业架构主要由支持业务线的架构团队管理。在大多数组织中,架构团队负责概述架构模式和通用框架,这将有助于工程和产品团队不必花费数小时的精力进行概念验证,而是帮助他们采用基于模式设计核心构建块的策略。

  • 理解卷积神经网络

    神经网络是一种系统,或者说是神经元的结构,它使人工智能能够更好地理解数据,从而解决复杂的问题。虽然网络类型多种多样,但本系列文章将仅关注卷积神经网络 (CNN)。CNN 的主要应用领域是模式识别和对输入数据中包含的对象进行分类。CNN 是一种用于深度学习的人工神经网络。这种网络由一个输入层、几个卷积层和一个输出层组成。卷积层是最重要的组件,因为它们使用一组独特的权重和过滤器,使网络能够从输入数据中提取特征。数据可以有多种不同的形式,例如图像、音频和文本。这种特征提取过程使 CNN 能够识别数据中的模式。通过从数据中提取特征,CNN 使工程师能够创建更有效、更高效的应用程序。为了更好地理解 CNN,我们将首先讨论经典的线性规划。

  • 机器学习和人工智能如何改变移动应用中的医疗诊断

    长期以来,医疗保健一直是一个数据密集型领域,而如今,人工智能和机器学习的融合正在开辟新的领域,尤其是在诊断领域。作为开发人员,我们处于这一转变的前沿,构建移动应用程序,帮助患者和医疗保健专业人员更快地做出更好的决策。从提高诊断准确性到加快早期疾病检测,人工智能驱动的移动应用程序正成为现代医疗保健中不可或缺的工具。

  • 分布式互斥的高效容错解决方案

    在分布式系统领域,确保在任何给定时间只有一个进程可以访问共享资源至关重要——这就是互斥发挥作用的地方。如果没有可靠的方法来实施互斥,系统很容易遇到数据不一致或竞争条件等问题,从而可能导致灾难性的故障。随着分布式系统变得越来越复杂,对管理共享资源访问的强大算法的需求变得越来越重要。

  • 定义 2024 年的 7 种产品设计趋势

    进入 2024 年,令人着迷的技术融合为新型创新设备打开了大门。人工智能/机器学习、电池创新、先进机器人技术和物联网的并行路径正在碰撞,为解决新旧挑战提供了新颖的方法。

  • 通过智能分块和元数据集成获得更好的搜索结果

    通常,我们开发基于 LLM 的检索应用程序的知识库包含大量各种格式的数据。为了向LLM提供最相关的上下文来回答知识库中特定部分的问题,我们依赖于对知识库中的文本进行分块并将其放在方便的位置。

  • 深度学习实践者指南

    我们的世界正在经历一场由深度神经网络驱动的人工智能革命。随着 Apple Intelligence 和 Gemini 的出现,人工智能已经普及到每个拥有手机的人。除了消费者人工智能之外,我们还将深度学习模型应用于汽车、金融、医疗、制造业等多个行业。这促使许多工程师学习深度学习技术并将其应用于解决项目中的复杂问题。为了帮助这些工程师,必须制定一些指导原则,以防止在构建这些黑盒模型时出现常见的陷阱。

发布文章